▼以下の文章は1999年5月30日の状況をベースとして書いていたものです。→最新の状況

報告書電子化の現状:旧稿

 実は、報告書を補足する形でデータのみ電子化するやり方は、一つの潮流として存在しています(※1999年後半から流れは変わったようです)。つまり報告書そのものは電子化せず、本文と実測図等は在来型の印刷報告書に頼るものです。1999年現在でもこの傾向は続いています。しかしHTMLはともかく、現在ではPDFならば印刷会社に頼めば簡単に出来てしまいます。後は、ただ実行すれば済む話なのですが...(本ページ末尾参照

 かつて、東京都板橋区等で3.5インチFDを付録とした例がいくつかありました。これらは観察表主体でしたが、本文テキスト全文がこっそり収録されていた例もありました。CD-ROMの時代になると、群馬県安中市で、写真をコンテンツとしたCD-ROMが制作された例があります(1996・1997年版、但し1999年になってシリーズ完結により、配付開始)。

 1997年6月にAcrobat日本語版が登場したのを踏まえ、筆者は1998年3月期発行の報告書で、CD-ROMを制作し、添付しました。無論、全国の主要機関等に配付済みです。管見の限り、報告書全頁をPDF化してCD-ROMに収録したのは、当時としてはこれが唯一だったようです。なお、データやカラー写真等のコンテンツも用意してあります。また1998年には大宰府市でも、写真を収録したCD-ROMが作られ、配付されました(1999年にも作られましたが、これは未配付)。

1998年3月発行の報告書:

1999年3月発行の報告書では、添付CD-ROMは少なくとも以下の6例を確認しています:

 99年分のうち、日影山と西台後藤田、及び加東郡の年報が、報告書全頁をPDFにしています(他の例では報告書本体は収録していないようです)。日影山と西台後藤田では、Excelやテキスト(タブ区切り等)などの再利用しやすい構造データも収録されています。真田北金目では、表関係を、画像(但しHTMLで閲覧可能)や主要なワープロ(Word、一太郎)の形式で収録しています(あと2遺跡は未見)。実は真田北金目でもPDFは利用されているのですが、エキストラなカラー写真を収録するだけの目的で利用されています。なお西台後藤田では、各種図面をDXF形式(LZH圧縮もかかっています)でも収録しています。ただし各ファイルは、一つの遺構に対してさえ、平面図や断面図といった、部品単位になっており、例えばA4の紙面にレイアウトされた状態というわけではありません(まとめる時間が無かったようです)。ちなみに、加東郡の年報PDF(1998年度版)でも、貼り込まれた図のフォーマットはDXFでした。

 DXFは、CADデータ交換用の中間ファイル(但しAutoCADのバージョンに依存)ですが、オブジェクトは全て線分の集合になってしまうようです。ベクターデータ交換用には、データのオブジェクト性を保持しやすいフォーマットの方がいいような気がするのですが(つまりDWGそのもの、ないしポストスクリプト系フォーマット)。99.11.27追加→アプリクラフトのCADgate(イラストレータとDXFやDWG等との相互変換)

 なお、西台後藤田のPDF版は、印刷版と同一内容ではありません。PDF作成後に、文章にかなり変更が加えられています(誤字の修正といったレベルではなく、推敲)。また、PDF版の元データがそのまま印刷に使われたのではなく、完全に再構成されて、集版データが作成されたようです。こうした結果、PDF版と印刷版は、実質的に別の編集物になっています(一見似てはいますが...)。

 岡本前耕地と日影山では、印刷用のDTPデータが本当に完成した後に(もうこれ以上校正を行わないことが確定した時点の後に)PDF変換を行っていますので、PDF版が、印刷物と、実質的に等価な存在であると主張できます。内容が同じだからこそ、印刷物に完全にとって替わるPDF版の存在価値を主張できるのです(印刷版がモノクロで、PDFがカラー化されているのはOK…実はRGBデータを上手く出力すると、同じデータが使い回しできます)。PDFは、文献保存の一形態(マイクロフィルムの電子的代替物)であり、文献参照の対象たることを期しているのですから、これは重要なポイントです。

 無論、誤字の修正程度は許容されるだろうし、すべきだと思います…あまりひどい場合は、その旨断わった方がいいかもしれませんが...
 またPDFは、やはり文書の区切りごとに、いくつかのファイルに分割して作ったほうがいいような気がします(特に、あまりにも巨大なファイルは考えものです)。ファイルを分けても、リンクは自由にはれますので、不都合な点は何もないはずです。

コンテンツ...

 1999年6月にはAcrobatもver.4になりました。新機能である、写真のプロファイル埋込み、及び日本語フォントの埋込みをしない限り、従来のPDFとの互換性は保たれています。フォントの埋込みは、外国向けに日本語版PDFを配付する場合に有効でしょう(無論、東アジア圏の多言語PDFも実現できます)。でも当分の間、Acrobat 3との互換性を保つため、国内向けの基本的な配付用PDFに、フォントの埋込みはしないように!(但し、Mac OS Xの17000字収録で、従来のJISにない漢字を埋込む意義が生じたようです…00.4.29…)

 岡本前耕地と日影山で特筆されるのは、報告書全頁PDFを収録した上で、それとは別に報告書のテキスト全文をHTML版で用意していることです。但し、実測図等の図版をHTML版に収録することは(理想的とはいえ)手間がかかりすぎるので、断念しています。なお、カラー写真にはHTML文書でサムネイル画像も用意し、閲覧用の中程度の画像(600×400〜700×500)にリンクしています。これらのコンテンツは全て、トップページからリンク(ないし紹介)されています。高解像度画像は、別に用意してあります。

 また日影山では、同じ組織で出した過去の報告書も、スキャン画像データ(原則として135dpiのグレースケールGIF、階調を減らして容量圧縮)として、HTMLで閲覧可能にしています(岡本前耕地では土器図版のみPDF版で再録)。過去の報告書については、PDFを作るための元データ(DTPデータ)が入手できなかったからですが、こうした手法で過去の報告書資産を電子化していくことは、面白いのではないでしょうか(画像をPDF化してもいいのですが... ※Acrobat 4からは2値画像のアンチエイリアス表示ができるようになったので、事情が変わりました)。構造化データ(テキスト)にできなかったことは残念ですが、手間とコストを考えると、スキャン画像に頼るのも、現実的な解決策です。

 スキャン画像データは横880ピクセルになっています。この表示画面で見る図版は、理想的なHTML版報告書に利用される図版要素と、同じようなものになっているはずです。つまり図版要素の表示サイズ(解像度)は、こんなものになると思われ、そのためには、XGA以上のディスプレイをターゲットにするのが、適当であろう、ということがわかります。もっとも横880ピクセルの画像は、縦1420ピクセルくらいですから、縦方向をスクロール無しに表示するには、縦方向1600ピクセルくらいのディスプレイが欲しいことろです。現状ではXGA程度が、ユーザに要求できる限界でしょうから、その範囲で使いやすさを工夫する必要があります。

これから...

 印刷版が存在しないPDFなどのCD-ROMの場合(あくまで一般論ですが)今後問題になるのは、やはりその完成度でしょう。印刷版が存在していると、少なくとも商業印刷可能な完成度のデータが作成されたことが分ります(データの最終作成者が印刷会社である場合が多いとしても...)。DTPデータの完成度は(編集デザインや校正の完成度も含め)、なかなか容易に達成されるものではありません。

 また、これは編集デザイン上の工夫で何とかなる問題でもあるのですが、PDFは一般に全体がつかみにくいので、やはり文章だけでよいから、HTML版が欲しいところです。一般にHTMLはインデックスが整備され、個々のファイルが小さい傾向があるので(無論、心掛けによりますが、PDFにくらべれば...)、読み込みや、レスポンスも軽い傾向があります。昨今では、Webブラウザが全てのアプリケーションの中心になりつつある、ということもあります。

 パッケージ化と同時に、各機関としてネットワーク対応を図ることも重要な課題です(インデックスやサマリーを掲載するためにも)。機関の動きが鈍いとしても、少なくともCD-ROMの中に、関係者への連絡用のURLかメールアドレスを入れておくべきです。今後の展開はともかく(リソースに対するポータルをどうするか...)、情報の所在をオンラインでアクセス可能にしておくことが、ディスクを配付する際には不可欠なはずです。

 電子化(あるいは高度情報化)には、構造化、クロスプラットフォーム性、アクセス性が不可欠です。これらの点が弱いと、電子化や情報化を形の上で推進することはできても、なかなか「もの」にはならないでしょう。CD-ROM化の推進が、入手しにくい在来型報告書と同類のものになってしまっては困ります。重要なのはコンテンツであって、CDという実体ではありません。近い将来に(早ければ2001年頃... 遅くとも2010年頃)高速インターネット環境が整ったならば、WWWが報告書の媒体と化す<ポテンシャルを得る>ことは、目に見えています(無論、その場合でも、CDは超長期保存媒体として有効性を失うわけではありません)。

現実的な解

 報告書の全面的なHTML化を目指すと、泥沼にはまり込む危険があります。マルチメディアというキーワードに惑わされることも多く(むしろメディアリッチを提唱します 00.9.4)、どんなレイアウトがいいのか、定まりどころがないのです。無論、印刷報告書の完全な再現は殆ど望めません。一般には画像のスケーラビリティ(縮小・拡大)もありません。Shockwaveでは互換性が充分ではなく、それくらいならPDFの方がエレガントです。

(ここでは必ずしもお薦めしませんが)HTML+CSSで電子化を実行することは、確かに可能です。その場合、QuickTime、Shockwave、PDFなどの、HTML必須でないフォーマットに対して、GIFやJPEGの範囲で代替ファイルを用意することが望ましいでしょう。(00.9.4)このスタンスは、Open eBookでも言われていることです。

 そもそも印刷の入札時の仕様書に、DTP方式の集版とPDF変換・PDFファイル納入を条件にすれば、いいのです。技術的に、埋文側がすることは何もなくても大丈夫です(在来型入稿でOKです!)。印刷会社には、オフセット印刷レベルのPDF(高解像度版)と、基本的な閲覧用のPDF(写真は100〜150dpi、線画は300〜600dpi)の2種類を、納入してもらったらいいでしょう(オンライン用に、もっと軽いバージョンも用意したい)。なお、ファイル名・フォルダ名は、ISO9660のレベル1準拠にすべきでしょう(建設CALSでも推奨されています (00.9.4))。

 CD-ROMを作るには、報告書の頁数が少なすぎる場合があるかもしれません。その場合、PDFファイルは埋文担当者が保管しておき、いくつかの報告書が貯まったところで予算をつけてCD-ROM化するか、それもできなければ、端からどこかのサーバに預けてしまえばいいのです(一つとは限りません)。国会図書館に納品すれば、後は国会図書館から配付してもらえるようになるかもしれません。

 今では、CDの容量いっぱい(600MB超)あっても、CD-R作成には10分程しかかかりません。つまり、たまにリクエストがある程度なら、その都度CD-Rを焼いて郵送したっていいのです(定型外50g以下で120円)。無論、その手間はどこかの会社に委託してしまってもいいのです(手間賃・実費含め、最大でも1000円でいいでしょう)。

 無論、そこで必要になるのが、抄録やサマリーなどのメタデータです。報告書の内容が大体分るような情報を、オンラインで用意しておくべきなのです。そのサービスは、自前でもいいし、どこかに委託してしまってもいいでしょう。


<WebSiteTop  →報告書電子化の現状:最新の状況