4.7 TNM (Topic Navigation Map)


次の規格原案(Committee Draft)の用語の定義までを翻訳して, その概要を示す。

ISO/IEC CD 13250

ISO/IEC JTC1/SC18/WG8

Document Processing and Relating Communication --
Document Description and Processing Languages

Title:
Information Processing -- SGML Applications -- Topic Navigation Maps
Source:
ISO JTC1/SC18/WG8
Project:
SGML Rapporteur Group
Status of Document:
Committee Draft
Requested action:
Approval of Committee Draft
Summary of major points:
Revised CD
Distribution:
National bodies participating in or observing the activities of JTC1 SC18/WG8

情報処理 -- SGML アプリケーション -- トピックナビゲーションマップ

まえがき

本規格は, 相互に関連した情報を含む膨大な文書に対するトピックを基礎にしたナビゲーション援助機能を作成, 保守及び交換する機能を提供する。これは, データの符号化方式を考慮した上で, 電子情報アーカイブの任意の形式に適用される。

印刷された出版物のライブラリにある情報を見つけたい場合, 次の3つの典型的な技術を使用できる。

現在読んでいるテキストの理解の補足するには, 次の事が行なえる。

人間が, 紙ベースの出版物で情報を探すことから電子的なアーカイブにあるデータを探すために電子的な検索エンジンを使用することへ切り替えるとき, これらの個々の技法と同等な機能を提供する必要がある。しかし, 現在オンライン用文書ブラウザの機能は, 必須機能のほんの少しの部分に制限されている。

Webサイトで提供される別個のファイルから成る電子「文書」のカタログを設定するのは特に難しい仕事ではないが, 文書へのアクセスを行なうために分類されたディレクトリを提供するサイトはまだほとんどない。もっと難しいのは, 広い範囲のサイトに適用されるカタログを設定することである。多くのWeb検索エンジンは, 局所的に決められた何らかの分類方式を使用して, 参照する文書を分類するにことによってこれを行なう。これらの方式が, 多くの図書館で使用されているDewey Decimal分類法及びLibraryof Congress分類法といった広く知られた分類方式に基くことがめったにないという事実により, 異なるWebの分類方式間の関係を判断することが難しくなる。

注:ページがユーザの照会に対する応答として生成される仮想サイトのカタログの設定は, 一般的に不可能である。

ハイパテキストマーク付け言語(HTML)により提供される限られたデータリンク機構のセットに基く既存のインターネットWebサイトにより, オンライン文書への参照は, 特定のユニフォームリソースロケータ(URL)への活動化可能なリンクへと形を変えることができる。 この技法は識別されるデータの格納位置が変わらない限り機能するが, 文書がアーカイブ内で, あるいは他のアーカイブへ複写されたとき誤りを起こしがちである。

インターネットURLは, 前もって名前が付けられた文書内の地点を参照することができる。これにより, 関連する行をクリックすることによって文書内の固有な名前を付けられた節へと移ることができるという活動的な目次を開発することができる。

索引をHTMLで開発するのはもっと難しい。文書中のすべての地点に固有な名前を割り当てなければならないということは別としても, 用語が存在する複数の個所を参照するのに使用できる印刷されたページ番号に相当するものが出版物の電子版にはないという付帯する問題がある。このため, ほとんどのWeb文書には索引がない。その代わり, ユーザは, 最初に使用されたときに用語の定義が行われてたはずであるという前提で, 用語のすべての出現個所を見つける全文検索機能に依存している。

頭字語, 単語及び句の意味を見つけるということになると, Web全体の全文検索エンジンが時として助けとなるが, 普通, そのような一般目的の検索ツールは, その用語を含む辞書を識別するのではなく, その用語を使用する何千もの文書の一覧を返却する。

同義語を見つけるということになると, 同一の言語又は別の言語のどちらにおいてもWWWは真のp助けとはならない。オンラインでは他言語の同義語はほとんど得られないので, そのような他言語の用語を識別するために, ユーザは, 印刷されたシソーラス又は多言語辞書に戻らなければならない。

印刷された出版物及び電子的な出版物の両方とも, 多くの読者の真の必要を満たすことはできない。ある主題について知るためにどんな助けを実際に求めているかと読者に尋ねれば。その答えは普通次のようなものである。

そのような質問に答えるには主題に関する専門知識を必要とする。また, 元の出版物の前後に渡ってその主題を長い期間追っていることも必要である。そのような情報が任意の長期間提供されるべきであるなら, 補足的な情報を提供するという仕事は協力の元に成し遂げられなければならない。これを可能にするために, ある出版物に関連する補足情報が果たすべき役割の明確な記録が必要である。そうすれば, 後になって知識ベースを拡張する人が既存の情報の目的を完全に理解することができる。

WWWでのインテリジェント検索機能を提供する多くの提案が, 出版物にメタデータを付加するという概念に基いており, これによって検索エンジンは自動的に適切な分類カテゴリを出版物に関連付けることができる。異なる型の選択過程に対して異なる集合のメタデータが適用されるべきてあるとの提案が行われてきた。共通に使用されている例には, 出版物を記述するためのDublin Coreメタデータ集合及びソフトウェアの記述のためのOpen Software Descriptionがある。多くの場合, ISOのSGML(Standard GeneralizedMarkup Language)のサブセットであるXML(eXtensible Markup Language)が, このメタデータを符号化するのに最も適していると提案されてきた。

情報の特定の部分が参照される必要がある多くの理由が存在し得る。出版物及び電子アーカイブは異なるコミュニティによって異なる理由で参照されることがよくある。これは, ある一つのファイルに関連付けられる補足データに多くの異なるソースが存在し得ること, あるひとつのファイルの同じ部分がそのような複数のソースから参照される可能性があることを意味する。このデータがすべてソース文書に追加されなければならないとしたら, それは絶えず変化する。

どの追加の情報ソースが文書のどの部分に適用されるかを識別する機構をユーザが持つことは重要なことである。ユーザが文書を見るとき, 興味のある出版物のある部分を識別でき, その主題に関する追加情報のソースの一覧を要求することが必要となる。これは, 出版物が格納される元の形を変える許可が必ずしもなくても行われなければならない。

ISO/IEC 10744は, HyTimeとして知られるハイパメディア/時間依存構造化言語(Hypermedia/Time-based Struturing Language)を定義している。HyTimeは, ソース文書の一部として格納する必要なしに出版物に追加情報を関連付けることを可能にする技法を統合する。HTML及びXMLと同様, HyTimeはSGMLに基いている。しかし, HyTimeはマルチメディア出版物の中の任意のテキスト, イメージ, 音響効果, 又は空間領域を参照することができる。

HyTimeの重要な面は, 参照からそのアドレスまで, 情報のアドレスをシステムに依存しない形で独立して格納することができるということである。これにより, 自動アーカイブ管理機能をシステムに組み込むことができる。これらの機能は, アーカイブが再構築又は新しい位置に移されたとき, どのアドレスを変える必要があるかをチェックするのに使うことができる。

HyTimeを使えば, ナビゲーションマップの形で表現される専門知識が読者によって制御可能な方法で電子的な情報集合と関連付けられるシステムを開発することが可能となる。同時に, 異なる情報集合によって共有される知識ベースを作成することが可能となる。本規格は, 関連情報のソースを見つけるときに読者を導くために, そのような'トピックナビゲーションマップ'を作成するためにHyTimeがどのように使用されるかを示すものである。

適用範囲

本規格は, 共通のトピックを共有する情報オブジェクトを識別するためにISO/IEC 10744:1997に基いた技法を提供する。これは, 関連するトピックの集合間の関係を定義するのにも使用できる。

本規格で定義される技法は, 他の使用と共に次の定義を行うために使用できる。

引用文献

定義

ISO 8879:1986及びISO/IEC 10744:1997での用語や定義及び次の用語及び定義が本規格に適用される。

体系形式(Architectural forms)
文書pの構成要素を作成, 処理するための規則。ISO/IEC 10744:1997では, 要素形式, 属性形式, データ実体形式, 及びデータ属性形式の4つの体系形式が定義されている。
体系形式定義要件(Architectural Form Definition Requirements (AFDR) )
駆動的な(***)文書体系が文書のSGML表現を支配するための体系形式を公式も定義するためにISO/IEC 10744:1997の付属書Aで指定された要件。
ハブ文書(Hub document)
ハイパ文書へのアクセスが始まるHyTime文書。
HyTimeハイパリンク(HyTime hyperlink)
二つ以上のオブジェクト間の関係を表現するISO/IEC 10744:1997 で定義された体系形式を使用して定義された情報構造。
出現規則
HyTimeハイパリンクのアンカーの役割として定義された属性, 又はそのようなリンク内のアンカー指定として定義される要素の名前で識別される役割,
意味割当て
共通の意味を共有する情報オブジェクトを結合する特別なHyTimeハイパリンク。
TNMエンジン
トピックナビゲーションマップを処理することができるエンジン
トピック
意味割当て要素により参照されるオブジェクトの集合
トピック関係
意味割当ての二つ以上のトピック又は集合間の関係。

[4.目次に戻る] [4.8に移る]