6-6 JTC1/SC34 文書の処理と記述の言語

小町 祐史 (松下電送システム(株))

1. 担当範囲と組織構成

SC34(Document Processing and Description Languages)は, 広義の文書情報の交換に用いられる文書データの構造記述, ハイパリンク記述, スタイル指定, フォーマット済み文書記述およびそれらに必要なフォント情報に関する標準化を行う。議長は, J. Mason(US)。13ヶ国のPメンバ(投票権のあるメンバ)と4ヶ国のOメンバ(投票権のないメンバ)が参加して, 次のWG(作業グループ)が組織されている。

WG1(マーク付け言語) -- コンビナ(作業グループの議長): C. Goldfarb(US)
SGMLに代表される情報記述言語およびそれに関連するサブセット, API, 試験, 登録などの規格を担当する。

WG2(情報表示) -- コンビナ: 小町祐史(日本)
文書のフォーマティング, フォント情報交換, フォーマット済み文書記述およびそれらのAPIを規定する規格を担当する。

WG3(情報関連付け) -- コンビナ: S. Pepper(Norway)
文書情報のリンク付け, 番地付け, 時間依存情報表現, 知識処理および対話処理を規定する規格を担当する。

2. 主要プロジェクトの進展状況

2.1 WG1関連

(1) 文書スキーマ定義言語(DSDL)

日本提案のRELAXに対する対抗案としてUKは, ISO/IEC 13250(トピックマップ)およびISO 8879(SGML)を支援する文書スキーマ定義言語(DSDL)のNP(新作業課題)提案をSC34に提出してきた。2001年11月にNP提案は承認されたが, UKが提案する内容に対して各国の反対があり, 再構成の議論の結果, XML Schema, RELAX名前空間, RELAX NG(Grammar-oriented schema languages)等の既存のスキーマ関連規定を含むマルチパートの規格としてDSDLを構成することになった。

2001年12月には, 次のパート構成が合意された。パート0は, DSDL全体に関する規定を与える。パート1はRELAX名前空間に基づき, パート2はRELAX NGに基づく。パート3はXML Schema Part2に基づく。パート4はSchematronに基づき, パート5はXML Schema Part1及びPart2に基づく。

2001年12月の会議での議論に基づいて, パート0のCD(Committee Draft)テキストが作成され, パート2については, OASIS(Organization for the Advancement of Structured Information Standards)の規定文書"RELAX NG"をそのままCDテキストとして利用することになった。それらは, それぞれISO/IEC CD 19756-0, -2としてCD投票にかけられ, 承認されて次の段階に進むことになった。

(2) 規格文書のDTD(TR 9573-11)改訂

エディタはTR 9573-11改訂のためにISO中央事務局とリエゾンワークを行い, 改訂計画を文書化してSC34に提出した。2001年12月にSC34は, エディタに対してその計画に従ってPDTRを作成することを指示した。

この改訂計画は, TR 9573-11の翻訳として国内で公表された標準情報TR X 0004及びそれに対するスタイル指定の標準情報TR X 0013をマージしてJISとして制定するという日本規格協会における関連活動と同期し整合している。

この改訂案に対しては, 国際のSC34メンバから次の要望が提出されている。
- TR 9573-11には, XSLによるスタイル指定を入れてほしい。
- TR 9573-11の構造定義には, XML-DTDだけでなく, RELAX(又はRELAX NG)による定義も入れてほしい。

2.2 WG2関連

(1) フォント情報交換(ISO/IEC 9541)

Amd.3 to ISO/IEC 9541-1およびAmd.1 to ISO/IEC 9541-2の2件のFDAM(Final Draft Amendment)投票が行われ, いずれも承認された。ITTF(JTC1の印刷部門)の要求する校正作業にエディタが対応し, どちらのAmendmentも2000年12月に出版された。

これらの原案は, CICC多言語情報処理環境技術委員会のフォントWGにおいて, 南アジア諸国のフォントエキスパートのコメントを受けて検討され, SC34専門委員会のレビューを受けてSC34に提案されたものである。

注1: Amd.3 to ISO/IEC 9541-1
フォントリソースのデータ構造を規定するISO/IEC 9541-1に対して, 多言語文書の記述に用いられるフォント属性を追加する。
注2: Amd.1 to ISO/IEC 9541-2
ISO/IEC 9541-1のAmendmentで追加したフォント属性の交換フォーマットを規定する。 Amd.1 to ISO/IEC 9541-1については, 既にSC34の作業が終了し, ITTFの要求する校正作業にエディタが対応した。このAmd.1は, 2001年1月に出版された。

(2) SPDL(ISO/IEC 10180, 標準ページ記述言語)

これまでに日本などから提出されていたDefect Reportに応えるために作成された技術訂正Cor.1の案は, 2001年4月を期限とする投票にかけられ, 承認された。2001年5月の会議において, SC34はコメント対処を受理し, Cor.1の最終テキストを受理した。このCor.1は, 2001年10月に発行された。

(3) DSSSL(ISO/IEC 10179, 文書スタイル意味指定言語)

以前よりカナダなどから提案されていたDSSSLの拡張要求に応えるために作成されたPDAM(Proposed Draft Amendment)1の投票が行われ, 承認された。日本はこのPDAM1テキストに対して, technicalおよびeditorialなコメントを提出している。

2001年12月の会議において, SC34は, PDAM1に対するコメント対処を受理し, エディタに対して, それに従ってFDAM1テキストを作成し, それをセクレタリに送付することを指示している。

(4) フォント関連オブジェクトの登録(ISO/IEC 10036)

ISO Technical Management Boardは, ISO/IEC 10036に基づくフォント関連オブジェクトの登録機関としてGLOCOM(東京, 六本木)を任命する決定を行い, その旨が2001年7月にISO中央事務局からGLOCOMに通知された。

これを受けて, GLOCOMはフォント関連オブジェクトの登録活動を開始し, 2001年度内に99,000件を上回るグリフの登録要求を受け付けている。 この活動に基づき, ISO/IEC 10036に対する技術訂正Cor.2の要求が出されている。

2.3 WG3関連

(1) ISMID(ISO/IEC 13240, マルチメディア対話形文書)

ISMIDは,ユーザを含む環境との対話によって動的に内容表示を変化させるマルチメディア対話型文書の交換アーキテクチャを,ISO/IEC 10744:1997のHyTimeを使って規定する。このFDIS(Final Draft International Standard)テキストが9月の投票で承認され, 国際規格として発行された。FDISに関して, 日本は, 以前の投票での日本コメントがすべて反映されていることを確認し, 賛成投票を行った。

(2) TM(ISO/IEC 13260, トピックマップ)

ISO/IEC 13260に対する技術訂正Cor.1の案に対して, 9月に投票が行われ, 承認された。このCor.1には, トピックマップのJIS化作業において明らかになった修正すべき内容が含まれる。

注3: トピックマップ
いくつものハイパリンクをもつ電子文書においてはインデックス対象を一貫性をもって記述する必要があり,関連する文書セットとそこでのインデックス対象としての共通トピックを識別することが望まれる。そこでこの規格では,共通トピックとしての情報オブジェクトを識別するための体系形式を規定し,関連するトピック間の関係を規定する。

この課題に関するこれまでの議論は,1994年から始まったGCA(Graphic Communications Association)の"Conference on the Application of HyTime"において行われてきた。日本は当時からこのConferenceに参加して,動向を把握してきた。1996年には本件のNPに関する審議が行われ,CD(Committee Draft)と共にNP(New Work Item Proposal)の投票を行うことが決まった。議論に際しては,市販のHyTimeエンジンを内蔵した処理系(EnLIGHTen)による動作デモが行われている。

(3) HTML(ISO/IEC 15445, ハイパメディアマーク付け言語)

ISO/IEC 15445に対する技術訂正Cor.1の案に対して, 11月に投票が行われ, 承認された。このCor.1の案に対して, 日本はeditorialなコメントを付けて賛成した。

(4) TM(トピックマップ)関連規格

2001年4月のNP/CD投票およびNP/PDTR投票によって, TM照会言語(ISO/IEC CD 18048)およびTM概念モデル(ISO/IEC PDTR 18049)が承認され, 2001年9月のNP/CD投票によってTM制約言語(ISO/IEC 19756)が承認された。さらにTMデータモデルに関しては, 2001年9月にコメント提出が求められている。日本はいずれに対しても多くのコメントを提出している。

これらの多くの関連規格の関係を整理し, 今後のプロジェクト作業を明らかにするため, 2001年12月の会議ではTM roadmapを作成した。

2.4 Fast-Track提案

(1) RELAX Core(ISO/IEC TR 22250-1)

文書型定義(DTD)はパーサで構文解析できないため, DTDを処理するツールを作りにくく, しかも基本的なデータ型を扱うことができない。そこで, この問題を解決できる言語が強く望まれていた。既にいくつかの提案が出されていたが, それらの共通機能を実現する標準的な規定として, XML正規言語記述(Regular Language Description for XML, RELAX)が考案された。

最初の規定は, 単一の名前空間だけを扱うRELAXコアであり, TR X 0029として2000年5月に国内で公表された。このTRは, XML文書の正規集合を記述するための言語を規定し, その文法は, XML文書で使用可能なタグ名, 属性名, 許される文字列, それらの可能な組合せを扱う。

TR X 0029の英語版は, 通産省工業技術院(当時)からISO中央事務局にFast-track提案され, ISO中央事務局がJTC1に対して2001年5月を期限とするDTR(Draft Technical Report)投票(DTR 22250-1)を指示した。

DTRは賛成多数で可決されたが, 各国からの投票コメントに対処するため, 2001年8月にBallot resolution会議を新潟の国際大学で開催し, Disposition paperを作成すると共に, 最終テキストの準備を行った。最終テキストは2001年9月に提出され, ISO/IEC TR 22250-1として2002年2月に発行された。

(2) RELAX Namespace(ISO/IEC TR 22250-2)

RELAX名前空間による記述は,幾つものRELAXコアによる記述を組合わせることによって,複数の名前空間を扱う。一部の名前空間について,RELAXコア以外の言語によって記述することもできる。

この規定は, TR X 0044として, 2001年7月に国内で公表された。その英語版は, 情報規格調査会からJTC1にFast-track提案され, 2002年5月を期限とするDTR投票が開始された(JTC1 N6616, N6643)。このDTR 22250-2は, 賛成多数を得て可決された。Ballot resolutionは, 2002年12月を予定している。

(3) DSSSL Library(ISO/IEC TR 19758)

標準情報TR X 0010の英語版を, fast-track手続きを用いて, 10月にJTC1に提出した。30日レビューについては特にコメントはなく, 2002年5月を期限とする5ヶ月投票に入った。

DSSSL Libraryは, 標準一般化マーク付け言語 SGML(ISO 8879)又はXMLで記述された複雑な構造化文書に対して, DSSSLを用いてフォーマット指定を行う場合に用いるDSSSLライブラリを提供する。このライブラリを用いることによって, DSSSL及び組版に関する専門的な知識を必要とせずに, フォーマットのDSSSL指定を行うことを可能にする。

この内容は, JTC1又はSC34のPメンバでもOメンバでもない東南アジア諸国の文書にも密接な関係があるため, 2001年11月にCICC(国際情報化協力センター)の主催でネパールで開催された15th AFSIT(Asian Forum for the Standardization of Information Technology)でその参加者に紹介し, 議論とコメントをいただいた。