超長期保存のための戦略

デジタル化は、デジタルデータの超長期保存の仕組みを整備していく事と、セットで進められるべきだ。デジタルアーカイビングに関する戦略が求められている。本稿はそのための覚書である。なお日本では「デジタルアーカイブ」[注1]は、あまりにコンテンツの産業化の意味合いが強すぎるので、ここではキーワードとしては用いない。やはり、SLTA:Super Long Term Archivingである。

超長期保存の仕組みと前提

 この場合のデジタルデータは、1)刊行物…報告書、2)整理時の関連ファイル…バックヤードファイルの両方を含む。仕組みのオープン性(主に仕組み自体の明示性)や公開性(一定の条件と制限は必要)は当然として、要点のみまとめると、

  1. 一次資料も収録する:デジタル写真なら、撮影したオリジナルファイル。
  2. HTMLやJPEGといったプラットフォームに依存しない標準指向フォーマットをメインとする。
  3. CADなど、ベンダー依存データは、再生専用アプリケーション(無償配付)とセットで保管するか、互換性フォーマットで保管する(バージョン情報必須)。
  4. 関連ファイルは、それぞれ1フォルダに収める(パッケージ化する)。
  5. 標準的メタデータを用意する。
  6. データのバックアップは、全国に分散した複数の機関でアーカイブする。刊行物については、発行機関でのオンライン公開がメインだが、他のアーカイブ機関での公開も認める。また図書館での自由なアーカイブと公開を認める。バックヤードファイルについては、制限公開を認める。
  7. 機関のネットワークを含め、超長期保存の指針について広く合意する。

 パッケージとメタデータのアーキテクチャは、OAIS(ISO14721:2002)に準拠する(参考:「デジタル情報保存のためのメタデータに関する動向」)。

粒度

 刊行物の定義は、形式的には、内容の固定性と情報粒度の規格性にある。電子報告書の粒度については、大枠としては、通常の印刷版と同じだが、個々の遺構や遺物の情報が小さな粒度で参照できた方がよい。大粒度=報告書、小粒度=遺構カード/遺物カード、というイメージである。実際のところ、粒度は発行者の作成方針に依存するものだが、指針として提唱してもよいかもしれない。要は、小粒度情報の作成指針である。

メディアとデュプリケーション

 オンライン公開はともかく、保管メディアは光ディスクが筆頭にあげられる。今はDVDの普及期だが、次世代として青レーザー化が迫っている。青レーザーの第2世代は数百GBに達すると考えてよいだろう。現状では、CDかDVDということになる。

 デュプリケーション(複製)は永続的なデジタル情報保存の要だが、その間隔は期待寿命の50〜60%とするなり、一定の目安を決めた方がいいだろう。実際には、高性能なメディアが安定化した時に、デュプリケーションが早めに行なわれるかもしれない。

 また言うまでもないが、メディアの保存環境は部屋のレベルで整備すべきである。

URN

 こうした文化財デジタルデータのアーカイブに際しては、Uniform Resource Nameの作成指針を決めるべきだろう。発行機関のIDも必要になる。そうしたものは、デュプリケーションを繰り返す際に、受け継がれていく。


参考情報


注1
日本で「デジタルアーカイブ」というと、どうも、文化財デジタルデータの「リポジトリ」の意味あいが強い。リポジトリは、利用主眼、利用即応型の保管庫を目指す。例えば公共図書館の多くでは、収蔵図書の廃棄が行われている。そうした図書館は図書のリポジトリになっている。図書館収蔵図書にはライフサイクルがあるのだ、というスタンスもありうるとは思うが、アーカイブに「ライフサイクル」の概念は無い。デジタルアーカイブは、リポジトリであるよりも、アーカイブである点が重要なのだ。もちろん両者は背反命題ではない。頭の中の優先順位の問題であり、両方とも重要なのは言わずもがな。[03.7.11]

● index  03.7.7〜03.7.11