index 01.1.31…update 03.10.20…05.3.14…05.6.8

本サイトの根底にあるのは、実はXMLへの強い憧憬である。ここでは、XML関連の情報をまとめると共に、考古資料への適用について考えてみたい。
[05.3.14]CIDOC CRMがISOに提案された。
[03.6.27]タイトルをXML/Web探究に変更し、今後はセマンティックWebもテーマに含めていく。

[03.10.20]企画展・特別展・現地説明会等のイベント情報集成のためのメタデータセットを考えてみた。

XML/Web探究:ネットワーク時代のデータ技術

 XML(eXtensible Markup Language)それ自体は、特定のデータ形式を指すのではなく、データ形式の定義の様式を定めた体系である。普通は、メタ言語とされる。またXMLは、関連する多数の技術体系と合わせて利用する必要がある。以下、XMLという場合には、メタ言語としてのXML、具体的に策定されたXML規格、具体的なXML文書/XMLデータ、あるいはXML関連標準技術の総体など、色々な指示語とする場合がある。
 XMLやXML関連技術に準拠して作成された、具体的なアプリケーションは、日本でも徐々に登場しつつある。またXML及びXML関連技術の開発においても、重要なプレイヤーとして日本人が登場する。

 ・XML eXpert eXchange(アットマーク・アイティの情報サイト)
 ・XMLコンソーシアム

本サイト内の各稿

日本の現状

 日本国内でも各種のXMLが提案されつつある。全容は「XMLフォーマットのイエローページ」に詳しい(登録数は63[01.8.24]に達している)。

 筆者の知る限り、MML等の医療情報関係と、国土交通省(元建設省)の建設CALS/EC関係が最も充実しており、社会的広がりも大きく、実用段階に踏み込んでいる。またデータの性質も、考古資料の扱いに近いものがある。つまり、先行事例として研究すべき対象といえる。

建設CALS関係

 元は建設省土木技術研究所が発信地であるが、最近の状況は下記に詳しい。なお、発表時点でXML化の間に合わない技術は、XML以外の既存技術を活かして使うスタンスをとっている(将来は徐々に全面移行とは思われるが)。
▼建設CALSにおける電子納品要領・基準

  • デジタル写真管理情報基準(案)
  • 土木設計業務等の電子納品要領(案)
  • 工事完成図書の電子納品要領(案)
  • CAD製図基準(案)
  • 地質調査資料整理要領(案)
  • 電子納品運用ガイドライン(案)

 先行しているデジタル写真管理情報基準(案)は、それに準拠したアプリケーションが各種発売されている(多くの場合「国土交通省基準(案)」として言及されている)。

 なお地質調査資料整理要領(案)に地質コード案がある。興味深いので抽出して示す。

電子カルテ

 医療情報学の成果として、医療情報学会電子カルテ研究会を中心に開発されたのがMML(Medical Markup Language)である。バージョン1.0を越えた現在は、実用化のためのコンソーシアム(非営利特定活動法人)が活動を開始している(追記2005.6.8:最新版はver.3.0)。
▼MedXMLコンソーシアム

参考文献

  • 里村洋一監修、吉原博幸 他著 1998『電子カルテが医療を変える』日経BP社. 1890円. ISBN4-8222-8047-0
  • 里村洋一編著 2003『電子カルテが医療を変える 改訂版』日経BP社. 1890円. ISBN4-8222-8173-6

XMLとは

▼XMLチュートリアル(Microsoft)

 XMLは、利用分野のニーズに応じた、文書やデータの共通フォーマットの様式である。XML固有の制約もあるのだが、応用の可能性は広汎で、利用分野が無限にあるため、XMLへの期待も際限がない。

 XMLは、GML→SGML→HTMLの経験と学習効果を踏まえ、必然的に登場した技術といえる(無論、技術的にオーソドックスでありながら、ゲリラ的かつオープンスタンスであったことも重要な点である)。なお、SGMLとXMLは、共にメタ言語であり、SGMLのアプリケーションがHTMLである(XMLに準拠したHTMLも開発された→XHTML)。XMLはSGMLの改良版である。ここでは、全てを総称してML系とする。

 アプリケーションとは、定義が必要ということであるが、定義の中心はDTD(文書型定義)である(ちなみにXMLでは、DTD以外の定義手段も開発されつつある)。XMLでは、それぞれのDTDに準拠するvalid(妥当)なデータもあれば、実はDTDに必ずしも準拠しない、あるいは初めから用意していない(が、XMLとしての形式的整合性のある)well-formed(整形式)なデータも許される。この性質がXMLの汎用性を高めている。

 ML系の基本は以下のようなものである。

  • 一貫してテキストである→可読性や処理性が良く、再利用性も高い
  • 情報のエレメントを、開始点と終了点にタグを置くことで示す(無論、タグもテキスト)
  • エレメント同士は、入れ子になってよい→ダイナミックな構造を記述できる

 再利用性が高いということは、作成の当事者でなくても、事情に詳しくない第三者でも、データを活かすことが容易だということである。データの構造(データ間の関係)が温存されているから、作成の当事者が必ずしも予測できなかったような活用も可能となる。無論、作成の当事者であっても、当初とは異なる別の利用がやりやすい。

「別の利用」は自動化もでき、人手を介さずに重要なデータが交換活用できる。その恩恵は人間の生活を向上させるだろうし、社会としての生産性も向上させる。これこそITへの期待の根幹である。

考古学におけるXML

 考古学関連では、ML系といった技術的にオーソドックスな話題への関心は低いようである(皆無ではないが)。

CASS

 XMLのイメージとして、シンポジウムや研究会の情報を告知するためのXML例(思考実験)を示す。
● 研究集会情報XML

ADES

 XMLについては、かねてから注目していたのだが、1998年11月に思考実験として本サイトで公表したものがADES(Archaeology Data Element Set)である。
● ADES/XMLの可能性

 ADESは、[書誌情報][遺跡情報][調査情報][出土概要][遺物情報][遺構情報][文書構造]の7構成になっている。無論、必要に応じて任意のモジュールを利用することを想定しているが、とりあえず汎用的、基本的な考古学XMLエレメントを念頭に、網羅的に試作したものである。エレメントが重複しないように作成したため、色々と改版すべき点がある(例えば、調査情報にも位置情報が必要…位置情報は普遍性があるので、うまい手を考える必要がある)。

 羅列的な項目が多いが、一部に入れ子構造も活用した。羅列的な項目は、物理的書式を考えても旨味がないが、入れ子構造はXMLっぽい感じが出る(?)。無論、XMLは必ずしも閲覧のためのデータではない。

埋文XMLへの期待

 埋蔵文化財、即ち遺跡の情報を全国の研究者が共有しやすくするために、どのようなエレメントが有効なのだろうか。文書としては、報告書だけでなく、現地説明会のパンフレット、遺跡調査発表会等での発表要旨集、カラー図版主体の概報、といったものも視野に入れる必要がある。無論、比較的静的なものとして、遺跡台帳もある。これらに相当するXMLコンテンツが、各地の埋文サーバに格納・公開され、それら最新情報を横断的に検索・表示するWebサービスが登場することが、望ましい。条件を入力しておけば、それに従った情報集成が、研究者のデスクトップに表示されるようになるだろう。

 この種の研究開発こそ、考古情報学の基礎となるに違いない。


<WebSiteTop   筆者へのレスポンス.