7-6 ISO/IEC JTC1/SC34 文書の処理と記述の言語
Document Processing and Description Languages

小町 祐史
大阪工業大学

1. 担当範囲と組織構成

JTC1/SC34は, 広義の文書情報の交換に用いられる文書データの構造記述, ハイパリンク記述, スタイル指定, フォーマット済み文書記述およびそれらに必要なフォント情報に関する標準化を担務とする.議長は, J. Mason(US).10ヶ国のPメンバ(投票権のあるメンバ)と10ヶ国のOメンバ(投票権のないメンバ)が参加して, 次のWG(作業グループ)が組織されている.

WG1(マーク付け言語) -- コンビナ(作業グループの議長): M. Bryan(UK)
SGMLに代表される情報記述言語およびそれに関連するサブセット, API, 試験, 登録などの規格を担当する.

WG2(文書情報表現) -- コンビナ: 小町祐史(日本)
文書のフォーマティング, フォント情報交換, フォーマット済み文書記述およびそれらのAPIを規定する規格を担当する.

WG3(情報関連付け) -- コンビナ: S. Pepper(Norway)
文書情報のリンク付け, 番地付け, 時間依存情報表現, 知識処理および対話処理を規定する規格を担当する.

2. 主要プロジェクトの進展状況

2.1 WG1関連

2.1.1 文書スキーマ定義言語(DSDL, ISO/IEC 19757)

XML等で表現されるデータの構造, データ型, データ制約の定義を行うDSDLについては,次に示すとおり,RELAX NGの規定がまず2003年末に発行された後,2006年になって主要関連規定が次々と発行されて,DSDLとしての一応の体系が用意された.

(1) パート1(概要)

2006年4月にFCD投票で承認されたことを受けて,コメント対処に示す変更を組込んで,2nd FCDを作成することがエディタに指示された.2nd FCDは,WG1メンバによるレビューの後,投票にかけられることになっている.

(2) パート2(正規文法に基づく妥当性検証−RELAX NG)

パート2は,XML文書の構造及び内容に関するパターンを指定するRELAX NGスキーマが満たすべき要件を規定し,そのパターンにXML文書がどんなときマッチするかを規定する.Amd.1(Amendment 1)はRELAX NG用の簡潔な非XML構文を示す. Amd.1が発行された後,それに幾つかの軽微な誤りが報告されたので,Amd.1に関するCor.(技術訂正)案が作成され,それを投票にかけることになった.

SC34はこのパート2を無償公開(freely available)にすることをJTC1に求めると共に,今後のSC34の規格における文書化スキーマにRELAX NGの簡潔構文を採用することを推奨し, JTC1参加国が, ISO 8879のDTD又はW3C XML Schemaに代わってこの簡潔構文を利用することを推奨している.

(3) パート3(規則に基づく検証−Schematron)

パート3は, 文書部品間または複数文書間の一貫性制約をほとんど記述できないというこれまでのスキーマ言語の機能を補って, 一貫性制約だけを記述するスキーマ言語であり, XML文書の構造及び内容に関する制約記述機構を提供する. この規格は2006年4月を期限とするFDIS投票で承認され,6月に発行された.

(4) パート4(名前空間に基づく検証委譲言語−NVDL)

日本からFast-track手続きで提案し承認されたISO/IEC TR 22250-2(RELAX Namespace)をDSDLの体系に整合させたNVDLは, 異なるマーク付け語彙を記述するスキーマを組合せるための機構を規定する. この規格も2006年4月を期限とするFDIS投票で承認され,6月に発行された.

(5) パート5(データ型)

DTLL(Datatype Library Language,http://www.jenitennison.com/datatypes/DTLL.html を参照.)に基づくCDテキストが作成され,2006年5月を期限とするCD投票が行われた.そのコメントに基づく修正を行ってFCDを作成することがエディタに指示され,そのFCDはWG1メンバによるレビューの後,投票にかけられることになっている.

2.1.2 規格文書の構造記述とスタイル指定(ISO/IEC TR 9573-11 第2版)

2004年4月に発行されたISO/IEC 9573-11 第2版が規定する規格文書交換のための構造記述(SGML, XML)およびスタイル指定(DSSSL, XSL, XSLT)は,ISO Directivesに従った出版部門対応の規定が多く,必ずしもエディタにとって使い易いものでない.そこで第2版の部分集合に近い規定内容をもつエディタ用の構造記述およびスタイル指定がISO/ITSIG(Information Technology Strategies Implementation Group)によって要求された.この要求に応えて,Amd.1が企画され,そのプロジェクトが設立された.Amd.1としてのRELAX NGスキーマとXSLスタイルシートは,Sourceforge(http://sourceforge.net/projects/tr9573amd)に掲載されて,関係者に試用されている.

2.1.3 オープン文書フォーマット(ODF, ISO/IEC 26300)

ODF(Open Document Format for Office Applications (OpenDocument))は,Open Officeと呼ばれるオフィスソフトの文書フォーマットに使われている実装先行の規定であり,Microsoftによるオフィスソフトの独占状態に対抗するSun Microsystems,IBMなどによって推進されてきた.これは,Sun Microsystemsによって2002年5月にOASISに提案され,OASISのOpen Document Technical Committee (TC)で審議されて,2005年5月にOASIS規格ODF 1.0として制定された.OASISは,これを国際規格にするため,PAS(Publicly Available Specification)のFast-track手続きを用いてISO/IEC JTC1にそれを提出した.

JTC1は,ISO/IEC DIS 26300としてそれをJTC1メンバに配布し,2006年5月を期限とするDIS投票を開始するとともに,そのDISの審議をSC34に割当てた.投票の結果,このDISは反対なしで承認された.

2.2 WG2関連

2.2.1 フォント情報交換(ISO/IEC 9541)

(1) パート3(グリフ形状表現)のAmd.1

パート3は, フォント情報交換に必要なフォント情報の構造記述において, Type1アウトラインフォントに基づくグリフ形状表現の交換フォーマットを規定する.これのAmd.1は, ビットマップフォントに基づくグリフ形状表現の交換フォーマット規定を追加するものであって, 主としてISO/IEC 10036登録機関からの要求に基づく.FDAMテキストが2005年8月を期限とする投票で承認され,Amd.1として同年10月に発行された.

(2) パート1(体系)のAmd.4およびパート2(交換フォーマット)のAmd.2

2005年5月のSC34総会において,パート2におけるフォント参照の拡張に関する利用者要求を受理し, Amd.2(Extension to font reference)の開発のためのプロジェクトを設けた.同年11月のWG2会議では,Amd.2のWD(作業ドラフト)を作成したが.幾つかの属性がパート1の中で未定義であるため,それらをパート1のCor.において定義する必要があることを明らかにした.

その後,SC29/WG11がISO/IEC 14496(Coding of Audio-visual objects)のパート22としてOpen Font Formatの規格原案を提出した.これは,OpenType format version 1.4 font format specificationの規定内容を追認するものであって,既に業界で広く利用されていることから,SC34はSC29/WG11とLiaisonをとって,ISO/IEC 9541のパート1および2を拡張してこれまでの体系との整合をとることにした.そのため,パート1については,Cor.ではなくAmd.4(Extension to font resource archtecture)のプロジェクトを設けてこの要求に応える.

2.2.2 文書スタイル意味指定言語(DSSSL, ISO/IEC 10179)のAmd.2

Amd.2は, 多言語文書スタイル及び複雑な文書スタイルをDSSSLで記述し易くするために, 既存のDSSSL規定の幾つかの流し込みオブジェクトクラスの規定内容に拡張を与える.拡張される主な機能は, ドロップキャップ, ベースラインシフト, 多様なノンブルフォーマットなどである.2004年度に配布されたFDAMテキストが承認され, 2005年7月にAmd.2が発行された.

2.2.3 DSSSLライブラリ(ISO/IEC TR 19758)のAmd.1〜3

DSSSLライブラリは, SGML(ISO 8879)又はXMLで記述された複雑な構造化文書に対して, DSSSLを用いてフォーマット指定を行う場合に用いるDSSSLライブラリを提供する.このライブラリを用いることによって, DSSSL及び組版に関する専門的な知識を必要とせずに, フォーマットのDSSSL指定を行うことを可能にする.

このライブラリの内容に対する追加要求が, Amd.1〜3として議論されてきたが,2004年度にDAM1, DAM2が投票で承認され,2005年度になってDAM3が承認されて,いずれも次のとおり発行された.各Amd.の内容については,前報を参照されたい1)

2.2.4 文書レンダリングシステムを指定する最小要件(ISO/IEC 24754)

スタイル指定を伴う構造化文書の交換に際して, レンダリング結果の版面の保存を確保するには, 送端と受端でのレンダリングシステムにおけるスタイル機能の共通の最小要件のネゴシエーションが必要である.このネゴシエーションに用いるスタイル機能仕様記述を規定するNP(新作業課題提案)が,昨年度末にNP投票によって承認され,2005年5月を期限とするJTC1参加国のレビューの結果,プロジェクトが成立した.

2006年5月のWG2会議において,CDテキストが作成され,8月末を期限とするCD投票が行われている.

2.3 WG3関連

2.3.1 トピックマップ(TM, ISO/IEC 13250)

トピックマップの規格を再構成してTM規定のマルチパート化を図る作業課題が2003年度から行われているが,最近の主要パートの動向を次に示す.

(1) パート2(データモデル)

FCDテキストが2005年5月を期限とする投票で承認された後,何度もコメント対処の議論が行われ,2005年度末にようやくFDISテキストが完成した.これは2006年6月を期限とする投票で承認され,規格発行のための処理が行われている.

(2) パート3(XML構文)

FCDテキストが2005年5月を期限とする投票で承認された後,何度もコメント対処の議論が行われ,2006年8月にFDISテキストが作成された.

(3) パート6(簡潔構文−CTM)

次の要求に応えるため,簡潔なトピックマップ構文のNPが提案され,2006年3月を期限とするNP投票で承認された.

(4) パート7(図式記法−GTM)

トピックマップの構造はグラフモデルあるため,図式記法を使うとその構造をストレートに表現できる.既に図式記法を実装している複数のツールが存在し,広く利用されてその有効性も広く認識されているので,国際規格としての図式記法が望まれるに至った.

そこで提案されたNPは,特に次の要求の充足を目指すものであり,2006年3月を期限とするNP投票で承認された.

2.3.2 トピックマップ問合せ言語(TMQL, ISO/IEC 18048)

CDテキストが2005年5月を期限とする投票で承認されが,WG3はエディタに対して,コメントを反映した2nd CDの作成を指示し,2006年10月を期限とするCD投票が開始された.

2.3.3 トピックマップ制約言語(TMCL, ISO/IEC 19756)

CDテキストが2005年5月を期限とする投票で承認されが,WG3はエディタに対して,コメントを反映した新たなCDテキストの作成を指示し,2nd CD投票が2006年1月に行われた.この2nd CDテキストは承認され,2006年5月の会議でコメント対処が行われて,新ドラフトの作成が指示された.

参考文献

1) 小町: "ISO/IEC JTC1/SC34 文書の処理と記述の言語",画像電子学会誌 Vol.33, No.6 pp.1009-1012 (2004-12).