データベース応用 第 9 回 (データマイニングシステム) 「XML の API」 講義ノート目次

XML のアプリケーションのインタフェース仕様 (API) として、DOM が標準化さ れている。

DOM はプラットフォームに依存せず、XML 文書内のデータの検索、追加、削除可 能な関数を定義が定義されており、XML 文書の木構造をメモリに展開して操作し、 データの取り出しなどができる。

この他、API として SAX が提案されているが、イベント駆動型でメモリを DOM ほど必要とはしないが、情報を処理する順序が制約される。

XML が使われはじめたきっかけ

XML で発展を遂げたのは B2B EC (企業間電子商取引) である。

XML 文書の集まりをデータベースとして考える。

関係データベースのデータ構造は表形式である。一方、XML は Tree 構造で、 自由度が大きい。 Tag を用いて検索を行うことができるため、半構造データを扱うと考える。

XML 文書をデータベースで管理するにあたって、

  1. データ
  2. 書類

のうち、データに属するものならば、XML + DBMS の組み合わせが便利である。

  1. 非構造化格納法
  2. 構造化格納法
  3. ハイブリッド方式
  4. 木構造格納法

で分類される。