2000.1.17…00.1.18…00.1.22…00.1.23…00.1.25…00.1.27…00.2.4

『考古学研究』46-3へのリプライ

 『考古学研究』46-3(考古学研究会 1999.12、配付は2000年1月)に「発掘調査報告書の電子情報化について−フロッピーディスクからCD-ROMへ−」が掲載された。1992年頃に始まる、報告書へのフロッピーディスク添付の歴史を振り返り、CD-ROMへの移行と将来展望が語られている。

 筆者の考古学ジャーナルへの寄稿(1997.6)やWebサイトの内容について、特にISEKIDASやコアデータスタンダードについて紹介されたのは、まことにありがたいことであり、感謝したい。

 ただ、今の時点で、フロッピーディスクからCD-ROMへ、というテーゼには多少ずれを感じる(無論、現状はCD-ROM化の流れすら緒についたばかりである…今なら総合的なオンライン化こそ目標に設定すべきだと思う)。少なくともメディアとしての電子化が論じられる例は珍しいので、貴重な論稿なのだが、残念なことに、多くの事実誤認が含まれている。筆者のサイト「日本の考古学リソースのデジタル化(Digital Archaeology Resources in Japan)」のURLも違っているのだが、これはサイトのタイトルから、Yahoo等で検索可能だから、それほど問題ではないかもしれない。

全国の事情について、悉皆的に調査集成するのは実に困難なことです。
本稿について、事実関係の訂正や御意見等ございましたら、ぜひ、こちらまで情報をお寄せください。
特に報告書電子化・情報化の実例を(予定も含めて)教えていただけたら幸いです。


 多くの問題があるのだが、筆者の論旨について詳しくはWebを参照していただければ幸いである。

 まず、CD-ROM化の実例について基本的な情報が落ちている。CD-ROM化の現状については、下記のページにまとめてある。以下、内容は重複するが、かいつまんで説明したい。

  「報告書電子化の現状」

 CD-ROMの時代以降の話であるが、『中野谷松原遺跡』(群馬県安中市)で、1996・1997年に写真をコンテンツとしたCD-ROMを制作されたのが最初のようである。マスコミ報道も行なわれている。ただし報告書のシリーズが一応完結した1999年になって、ようやく全国配付に至ったということである(言い換えると、それまでは未発行だったということである)。

 1997年6月にAcrobat日本語版が登場したのをふまえ、筆者は1998年3月発行の『岡本前耕地遺跡』(東京都世田谷区)で、PDF主体のCD-ROMを制作し、添付した(印刷部数は700)。なお、本文のHTML版の他、表データ関係や100枚以上のカラー写真等(閲覧や再利用の便宜を考え、解像度別に4種)のコンテンツも用意した。管見の限り、報告書全頁をPDF化してCD-ROMに収録したのは、これが嚆矢である。無論、全国の主要機関等にちゃんと配付したのだが、どれほどのインパクトを与えたのか、あるいは与えなかったのか、筆者はあまり把握していない。CD-ROM内のINDEXページで、調査団のホームページ(調査団解散に伴い、2000年3月で閉鎖)やメールへのリンクも用意し、アクセスを待ったのだが、少なくともメール連絡は皆無だった。マスコミ発表を行なわなかったのは、遠慮しすぎだったのだろうか。

 また1998年には、福岡県大宰府市でも写真を収録したCD-ROMが作られた(『太宰府条坊跡 X』1998.3)。これは配付されている。1999年版も制作済みであるが、そちらは未配付とのことである。

 1999年3月発行の報告書では、CD-ROMは少なくとも以下の例を確認した。

 これらの内、上から3つまでが、報告書のPDF版を収録している(加東郡年報は印刷版は廃止)。あと2つは、データ主体のようである。実は『日影山・東山道武蔵路』CD-ROMは、筆者が制作に関わったものである(終盤になってから関与したので、既にスライド写真が調査団に残っていなかった。巻頭カラーのデータが、印刷会社にあるだけだったのである)。制作の基本路線は『岡本前耕地遺跡』を踏襲した。なお1999年中に、もう1件CD-ROM化された例があるのだが、これは近日配付と聞いている。2000年3月発行予定のCD-ROM例は、東京だけでも6件、他の地域でも2件は確認している(無論、今後も続々増えることを期待したい)。

 また遺跡調査支援企業が、報告書の試作CD-R版を作成した例も、2件実見している(試作版だからCD-Rである…レーベル面はプリントしてある)。


 CD-ROMコンテンツについては、PDF主体、HTML主体、PDF+HTML、またデータや写真に特化する例など、スタンスが色々である。筆者は、電子報告書の基本要件を、4つあげたことがある。

 「報告書の電子化−考古学及び埋文関連文書の電子化と公開について−」『考古学ジャーナル』418、1997年6月号

 そもそも、この寄稿文の目的は、報告書電子化のメリット、主旨を明らかにし、電子報告書のガイドラインを示し、電子化実行を準備することにあった。それは、タイミング的には成功した。電子報告書の基本要件とは以下のようなものである。これらの要件を、どういう形であれ全て実現していることが、必須と思えた。

  1. 印刷本のレイアウトを再現するフォーマット
  2. 電子時代にふさわしいハイパーウェア
  3. ブラウザを(必ずしも)前提としないその他の(互換性の高い)生データ
  4. インデックス用データ

 (この具体例については「報告書電子化の基本方針と展望」第2節に詳しい)

 印刷本のレイアウトを再現するフォーマットとは、事実上、PDF(Acrobat)を意味する。電子出版として充分な機能を備え、デファクトスタンダードとなったPDFを利用することで、紙を代替する電子版の、最大の拠り所としたのである。紙の代替については異論が多いが(オフセット印刷に向かないほどの少部数では、いわゆるオンデマンド印刷を活用したらよい)、当分の間CD-ROM添付という形態をとることで、問題の解決(いわゆるペーパーレス)は将来の再検討にゆだねた。ありていに申せば、PDFは、ペーパーレスの布石である。実際の制作ではHTML化も実施したが、これは全文検索や文献データベース処理の扱いやすさを考えたためである(但しPDFでそれを実現するアプリケーションも存在する)。これは、基本要件3に通じる意味あいもある。HTML版での図版収録は度外視したが、その点はPDFの方で、完全版(印刷報告書と同一)が見られるので、よしとした。

 振り返ると、筆者が電子化に注目したのは、ハイパーテキストの可能性であった。データの添付は、確かに一つのメリットであるが、本編そのものをハイパーテキスト化(ハイパーメディア化)して収録していくことこそ、電子化=デジタル情報技術の活用だと思えた(データの添付は、報告書全体の電子化の範疇で実現していく)。筆者は、これをメディア指向と呼んでいる(いわゆるマルチメディア指向とは異なる)。ハイパーテキストを実現するためには、作動環境=ブラウザが不可欠である。ハイパーカードではMacintosh版しかなく、クロスプラットフォーム性が確保できない。Windows版で作動する適当な環境は、データベースの発展形を含め、いくつかあったのだが、何にせよ、再生するマシンにブラウザをインストールさせる必要がある。エキスパンドブックはクロスプラットフォーム性があり、一つの業界標準を目指していたから、可能性を感じたのだが、これも結局普及しなかった。また最大でも640×480の解像度に制限されていることも、気に入らなかった。1996年にはエキスパンドブック版の報告書を試作したが、実用化は見送った。

 この頃は、ちょうどインターネットが台頭してきた頃であり、1997年にはHTML版の報告書を試作してみた。HTMLなら、インターネット普及のおかげで、ブラウザはユーザのマシンに既にインストールされているから、特殊な環境のインストールは必要なくなり、ハイパーテキスト実用化の期待は高まった。ブラウザも、その後無料化され、そもそもプレインストールが当り前になった。ただ、画像の扱いがネックだった。報告書のメインは図版だし、頁をラスター化して収録するのは可能だが、やはり通常表示に加えて(任意の倍率で)縮小・拡大表示ができないと、どうも本格的でない。HTMLベースでも、工夫すれば何とかなるのだが、作り込み作業になる。プラグインによる解決もありうるが、閲覧者にプラグインのインストールを要求することは、ためらわれた。いずれにせよ本格的な図版の収録には、膨大なエネルギーを必要としそうである(一括処理のしやすい、揃った図版データがあれば、話は多少違ってくるが)。何しろ、報告書自体を制作するのに忙しいから、余分な手間はあまりかけたくない。最大の問題点は、編集の二度手間である。それを解決するだけのツールも存在しなかった(印刷物を全く廃止できるなら、話は別)。そうしたものは、ある種の本格的なデータベース(DBMS)が相応しいのかもしれないが、それは高度すぎる話である。

 HTML版の可能性はあるが、報告書の電子化を認知させるには、役不足な気がする。どんなにデザインの優れたHTMLであっても、レイアウトは印刷物と離れたものにならざるをえない。電子化された報告書が、単に引き算された代用品のように見られてしまっても困る。リンクのインターフェースなど、高度なテクニックを駆使すれば、だいぶ違った印象を与える可能性はあるが、Scriptの完成度の高さが求められることと、ターゲットブラウザ(と、その設定状態)を限定してしまうのが難点である。いわゆるマルチメディア機能は、売りにはならない(一般のユーザには評判がいいが...)。結局HTML版では、原本へのニーズを否定しきれない。

 むしろ全く異なるパラダイムのコンテンツ…例えば、任意の図が引け、任意の基準で検索抽出できる、データベース的なものなら違うかもしれない。ただ、高度な機能に加え、クロスプラットフォーム性も必須だから、その実現時点ではJava版とせざるをえないだろう(ますますターゲットブラウザとプラットフォームを限定してしまうが)。制作の手間とコストも問題だから、結局将来の課題といわざるをえない。

 日本語版Acrobatの発売は、この状況で最高の朗報だった。画像の扱いがエレガントで、テキストの表示サイズもユーザの自由に任せられる。ディスプレイのサイズはフルに活用でき、ハイパーテキスト性も全て備えていた。PDFは印刷用のDTPデータからほぼ自動的に生成できるから、作成コストはゼロに近い(全く、手品のようである)。原理的に印刷版と等価な存在といってよく、印刷版を代替する電子版の立場を主張できる。マイクロフィルムの立場を奪うほど、PDFは文献保存の一手段でもある。適切なPDFデータであれば、何時でも印刷物を復元できる。HTML版のように、印刷版と全く別の編集物でもなく、編集の二度手間もいらなくなる。また、PDF内の画像の再利用も、PDF作成時に収録されたEPSデータやラスター画像の画質そのままで可能である(事実上、製品版のAcrobat 4.0とIllustrator 8.0、Photoshop等が必要 …余談だが、AcrobatはPDFWriterとの組み合わせで、ポストスクリプトでない画像のポストスクリプト化に利用できる)。

 現在、印刷版からCD-ROM版への流れは、莫大な印刷費や役務費の問題に直結し、リアルでソリッドな問題になりつつある。電子版に求められる、深刻な期待とニーズに答えるためには、PDFをメインに据える以外にない。PDFにはその資格がある。他方、HTMLも可能ならば取組むと共に(当面はテキスト主体でよい)、次世代的なXML化を目指すべきである。


 それにしても、全国の事情を集成することは、まことに難しい。インターネット上で報告書が公開されている例は、「青森遺跡探訪」「南河内考古学研究所」(書庫)など、いくつかの個人サイトに見られる。公式サイトでも、いくつか例はある(例えば『大宰府条坊跡VIII』)。早稲田大学考古学研究室名義でも例があるが、これはインターネット向けコンテンツの実験のように見える。本来なら、発行機関自身が行うべき報告書のオンライン化だが、従来の業務の常識から逸脱するのは、非常に困難なことのようである。ただし埋文センターなどから発行されているニュースなどの普及版は、PDFやHTMLで公開されている例が結構ある。論文などが、執筆者自身によって掲載されている例は、もっと多くのサイトに見られ、把握しきれないほどである。

 なお、『大阪狭山市内遺跡群発掘調査概要報告書4』(大阪狭山市教育委員会 1994)の第3章の主要部分「陶邑窯跡群 今熊1号窯(93―1区)」が、HTML版として制作され、公開されたのは1997年3月のことである。1994年ではない。先駆的な例であることに変わりはない。


 以下、技術的な問題についても、どうも誤解があるようなので、ふれておきたい。

[引用]PDF形式の利点としては、画像ファイルの容量が小さいことに加え、縮小画像(特に実測図)でも線がつぶれないこと、...

 これはよく言われる話なのだが、PDFの容量が小さいというのは、ベタのポストスクリプトファイル(DTPの頁の出力)に比較しての話である。特に写真が入っていれば、桁違いで当り前である。実際のところPDFの容量は、収録写真の解像度と、圧縮率の設定に左右される割合が最も大きい。写真の解像度を72dpi(ppi)にするのか、150dpiにするのか、はたまた300dpiにするのか、またJPEG圧縮率の設定如何で、容量が劇的に異なってくる。解像度設定も、圧縮率設定も、設定次第で全く自由にできる。写真を600dpiにした例もある。印刷でも最大350dpiしか使わないのに(高品位印刷の場合は別)、思い切ったものだと思うが、おかげで確かに写真は緻密になったが、頁あたりの平均容量は500KBにもなってしまった(よく考えてみると、写真の使用サイズを倍にすれば、300dpiになるのだから、問題は写真の掲載サイズである)。実際のところ(標準圧縮状態の)150dpiでも、充分な情報量があるように思う。ユーザの再生環境への負担を考えると、複数の解像度版を用意すべきかもしれない。高解像度版は、商業印刷対応レベルでよいと思う(印刷データのバックアップになる)。基本的な配付版=将来、電子図書館で閲覧されるものは、中間的な解像度(ローカルプリンタ対応レベル)のものでいいと思う(当分はAcrobat 3.0互換とする)。(現状での)オンライン公開版は、色々な工夫をして、容量をさらに減らすようにしたい。

 また筆者の場合、PDF化は印刷会社に任せてきた(ただし『岡本前耕地遺跡』は、手元でフルDTPで制作しており、MOディスク以外の入稿物は存在しない)。これは、校正の関係で、印刷する直前のデータをPDF化してもらいたかったからである。印刷版と電子版の対応関係は、重要なポイントと考える(印刷しないコンテンツが電子版に存在していることは、全く妨げるものではない)。

[引用]HTML(中略)だと、あまりパソコンの専門的知識がない人間でも、ある程度まとまったかたちで、情報をまとめることが可能である。そして、この方式を極めれば、音声、動画なども自在に組み込むことが可能である。

 全く同様の理由が、PDFを選ぶ理由にもなる。HTMLは(最も簡単な)プログラミングに近い。前述の通り、本格的な報告書の制作を考えると、PDFの方が制作しやすいと思う。また動画などの組込みも(動画や音声の組込みには、それなりの必然性が必要と思われるが)、PDFの方がどちらかというとエレガントである。ブラウザとしても、電子文献の閲覧を考えた場合、Acrobatの方がエレガントである。あまりパソコンの専門的知識がない人がHTMLに取組むには、技術力とデザイン力で、かなりの熟達が要求されるから、むしろ非現実的である(熟達した人は、もはや詳しい人といえる)。特に画像(写真)の処理は、専門的知識レベルを必須とする。印刷のためのDTPを経由したPDFファイルなら、印刷適性のある画像が用意されたことが推定できる。

 逆に考えると、DTPの実践が困難なことが、HTMLへの傾斜を招いているようだ。DTPは、広範で正確な知識を必要とする。印刷レベルのことになると、印刷会社に依存する場合が殆どであろう(DTP化していても、印刷会社に依存する部分を残す場合が、圧倒的と思われる)。印刷会社にDTPの完成とPDF化を任せれば済む話である。それは、通常の印刷委託の範疇だし、特にコストが付加されることはない。また、ワープロデータから、PDFWriterでPDF化することも可能である。

[引用]今後の方向性としては、(中略)初級(概報レベル)・中級(報告書レベル)・上級(研究レベル)といったように、多重構造化されていたりすれば良い。(1)初級では写真・イラスト・動画・音声・CG・クイズ・ゲームなどが組み込まれていて、調査成果を解りやすく表現し、...

 初級編は、イラスト・CG・ゲームなどの列挙から考えると、(Directorで作られるような)市販のマルチメディア系CD-ROMや博物館のメディア端末のコンテンツのようなものが想定される。

 報告書の概念を拡張していくことは、意味のあることだと思われるが、その種のものは生半可なことでは実現できない。一つの報告書を作っていくエネルギーと同等か、それ以上のものが必要となる。委託するとすれば、莫大な費用がかかる(程度問題だが、100万円単位と思われる…内製でも人件費はそれ以上にかかるだろう…ただしDTPの実現と同等以上の高度な技術レベルが要求される)。それは、通常の報告書作成の範疇では、とても実現できない。逆にいうと、通常の埋蔵文化財行政の範疇で実現できないから、原因者負担の範疇で実現したい、ということかもしれない。

 一般向けのコンテンツといっても、ごく簡単な概報の代わりなら実現できるかもしれない。筆者もそれは作ってみたいと思う。ただ、クイズ・ゲームといったものまで手をひろげるのは、通常の業務の範疇では無理だろう。ページ数にしても、ささやかなものになるだろう。また基本的にはオンラインベースにすべきだし(重いコンテンツはCD-ROMの方がいいとは思うが)、ISEKIDASのような、総合的埋文情報化の範疇で実現すべきである。


 今後、電子版の合理性が認知され、実体として信頼をえるようになれば、印刷版は従前の配付先機関に需要を確認して…CD-ROMだけでよいかどうか、やはり紙がいいかどうか…大体の冊数を決め(100部?)、CD-ROMは1000〜2000枚程度プレスしたらよいと思う。同時に報告書の詳しいメタデータを整備し、各機関でオンライン公開されたい。詳しく言うと、(1)書誌情報、(2)内容の解説、(3)各章節の要約ないし(字義通りの)抄録、(4)全文HTML版、(5)容量を特に圧縮したオンライン用PDF、(6)本来の閲覧用PDF、といった階梯が考えられる。

 (4)まではHTMLベースである(原本はXMLかもしれない)。(5)までは、当初からダウンロード可能にしたい。現在でも理由のあることであれば、数MB程度は許容範囲である(MP3等の音楽配信を見よ)。(6)以上に対しては、CD-ROMの在庫が無ければ、CD-Rを活用したらよい。近い将来には(6)も含めて全面的にオンライン化できるだろう。高速通信環境の普及にあと数年以上かかるとは思えない。

 HTMLの機能的高度化は、本格的なXMLの活用によって果されると思う。XMLは、意味を構造化できる可能性を秘めている。ドキュメント指向が真に電子的手段で実現されるのは、データベース的なXMLベースの編集手段が実用化し、普及した時ではないかと思われる。また、行政体の範囲を越えた埋文情報交換や情報収集、横断的な集成データベースの構築を容易にするための仕掛けを、XMLでドキュメントに埋込んでいくことも研究課題である。だが、個々のデータベースの構築と、流通するドキュメントの整備とは、自ずと別問題である。ドキュメントの整備は、データベースの整備に先行すると思う。一日も早く電子化を開始すべきである。報告書・研究誌等がドキュメントとして電子化され、蓄積・流通すること、それが考古学の情報化のスタートラインである。


PDF:
Portable Document Format。Adobe Systemsが、DTPの基本であるPostScriptをベースに開発した、電子文書フォーマット、あるいはPostScriptの改良版。コードネームがAcrobat。Acrobatは、PDFに関わるアプリケーションの名称にもなっている。印刷イメージを電子的にキャプチャーしたようなもので、ページ概念を持ち、拡大縮小自由である。無償配付されるAcrobat Readerで閲覧できる。印刷用の共通フォーマットとしても期待されている。電子文書としては、デファクトスタンダードとなっており、電子的な閲覧に適した高機能なフォーマットである。なお、フォーマットは公開されており、サードパーティによる利用も(PostScriptとは異なり)無償である。

関連文献


<WebSiteTop