超長期保存のための戦略
● デジタル化は、
デジタルデータの超長期保存の仕組みを整備していく事と、セットで進められるべきだ。デジタルアーカイビングに関する戦略が求められている。本稿はそのための覚書である。なお日本では「デジタルアーカイブ」[
注1]は、あまりにコンテンツの産業化の意味合いが強すぎるので、ここではキーワードとしては用いない。やはり、SLTA:Super Long Term Archivingである。
超長期保存の仕組みと前提
この場合のデジタルデータは、1)刊行物…報告書、2)整理時の関連ファイル…バックヤードファイルの両方を含む。仕組みのオープン性(主に仕組み自体の明示性)や公開性(一定の条件と制限は必要)は当然として、要点のみまとめると、
- 一次資料も収録する:デジタル写真なら、撮影したオリジナルファイル。
- HTMLやJPEGといったプラットフォームに依存しない標準指向フォーマットをメインとする。
- CADなど、ベンダー依存データは、再生専用アプリケーション(無償配付)とセットで保管するか、互換性フォーマットで保管する(バージョン情報必須)。
- 関連ファイルは、それぞれ1フォルダに収める(パッケージ化する)。
- 標準的メタデータを用意する。
- データのバックアップは、全国に分散した複数の機関でアーカイブする。刊行物については、発行機関でのオンライン公開がメインだが、他のアーカイブ機関での公開も認める。また図書館での自由なアーカイブと公開を認める。バックヤードファイルについては、制限公開を認める。
- 機関のネットワークを含め、超長期保存の指針について広く合意する。
パッケージとメタデータのアーキテクチャは、OAIS(ISO14721:2002)に準拠する(参考:「デジタル情報保存のためのメタデータに関する動向」)。
粒度
刊行物の定義は、形式的には、内容の固定性と情報粒度の規格性にある。電子報告書の粒度については、大枠としては、通常の印刷版と同じだが、個々の遺構や遺物の情報が小さな粒度で参照できた方がよい。大粒度=報告書、小粒度=遺構カード/遺物カード、というイメージである。実際のところ、粒度は発行者の作成方針に依存するものだが、指針として提唱してもよいかもしれない。要は、小粒度情報の作成指針である。
メディアとデュプリケーション
オンライン公開はともかく、保管メディアは光ディスクが筆頭にあげられる。今はDVDの普及期だが、次世代として青レーザー化が迫っている。青レーザーの第2世代は数百GBに達すると考えてよいだろう。現状では、CDかDVDということになる。
デュプリケーション(複製)は永続的なデジタル情報保存の要だが、その間隔は期待寿命の50〜60%とするなり、一定の目安を決めた方がいいだろう。実際には、高性能なメディアが安定化した時に、デュプリケーションが早めに行なわれるかもしれない。
また言うまでもないが、メディアの保存環境は部屋のレベルで整備すべきである。
URN
こうした文化財デジタルデータのアーカイブに際しては、Uniform Resource Nameの作成指針を決めるべきだろう。発行機関のIDも必要になる。そうしたものは、デュプリケーションを繰り返す際に、受け継がれていく。
参考情報
- デジタル情報保存のためのメタデータに関する動向 www.ndl.go.jp/jp/library/current/no275/doc0007.htm[03.9.6追加]
- アーカイビングガイド www.iecapc.jp/06/diffusenew/guide/archive_guide.html
- アーカイビング標準 www.iecapc.jp/06/diffusenew/standards/archives.html…各種標準のリンク集
- ディジタル情報保存のためのメタデータ www.tulips.tsukuba.ac.jp/memb/mtkuri/reports/metadata1.html …主にCedars Projectのメタデータ仕様について
- ディジタルライブラリとメタデータ−概要と課題 www.icot.or.jp/FTS/REPORTS/H14-reports/H1503-AITEC-Report3/AITEC0203R2-html/AITEC0303R2-ch3-5.htm
- 注1
- 日本で「デジタルアーカイブ」というと、どうも、文化財デジタルデータの「リポジトリ」の意味あいが強い。リポジトリは、利用主眼、利用即応型の保管庫を目指す。例えば公共図書館の多くでは、収蔵図書の廃棄が行われている。そうした図書館は図書のリポジトリになっている。図書館収蔵図書にはライフサイクルがあるのだ、というスタンスもありうるとは思うが、アーカイブに「ライフサイクル」の概念は無い。デジタルアーカイブは、リポジトリであるよりも、アーカイブである点が重要なのだ。もちろん両者は背反命題ではない。頭の中の優先順位の問題であり、両方とも重要なのは言わずもがな。[03.7.11]
● index 03.7.7〜03.7.11