4. WG3活動報告

4.1 背景と目的

Web環境で用いられる文書等の記述に用いる言語は, W3C(World Wide Web Consortium)などの, ISO又はIECとは異なるグループによって推進されている。これらのグループと密接な連携を保ち, そこで開発された主要な規定の翻訳を行なって標準情報(TR)の原案を開発する。必要に応じて, それらのグループに対してcontributionを行なう。

4.2 活動の経過

WG3およびXML/SWGは次の日程で委員会を開催し, 4.1.1〜4.1.8に示す標準化活動を行った。

WG3:
4/21, 5/26, 6/30, 8/03, 9/11, 10/02, 10/22, 11/06, 12/15, 01/26, 02/23, 03/15
XML/SWG:
4/15, 5/29, 6/02, 6/19, 7/24, 9/01, 9/25, 10/30, 11/27, 12/25, 01/11, 02/12, 3/18

その活動の初期においては, マルチメディア/ハイパメディア調査研究委員会の昨年度までの活動を受け継ぎ, 次の標準情報(TR)の出版対応(final review, proofreading)を行った。

4.2.1 EJB 1.0の翻訳

TR X 0005:1998"分散オブジェクト指向のプログラム言語及びその環境"は, Java言語規定(Java Language Specification)を与えると共に, その利用環境を明確にする。特にその3.6.1において, Java言語で実現したコンポーネントフレームワーク及びAPIであるJava Beansに言及し, コンポーネントをJavaで実装することが, Javaの利点であるプラットフォーム非依存性, セキュリティ, ネットワーク機能, GUI機能などを生かすことを示している。

しかし実際のJava Beans等のコンポーネントの内容については, TR X 0005:1998では規定されていない。このTR X 0005:1998の不備を補って, 分散オブジェクト指向のプログラム言語及びその環境に関する標準情報(TR)としての利用価値を高めることが, TR X 0005の原案段階において既に関連業界から強く求められた。

この要求に応えるため, WG3は1998年度の活動としてEJB(Enterprise JavaBeans) 1.0の翻訳作業に着手した。

4.2.2 TR X 0005改正原案(JB及びEJB)

EJBの翻訳を完成し, 昨年度に翻訳したJB(Java Beans) 1.01と合わせて, TR X 0005:"分散オブジェクト指向のプログラム言語及びその環境"の追補(改正)原案として, 1998年11月に工業技術院に提出した。

4.2.3 Java国際化

ISO/IEC JTC1/SC22/Java SG(国際および国内)とリエゾンをとり, 国際的に検討の遅れているJava国際化について, 調査研究を行った。SC22/Java SGの検討内容を当委員会でTR原案化し, TRとして公表された後, 直ちにFast-track手続きを用いてJTC1に提案するというストラテジを立案した。この計画については, 10/26-27のSC22/Java SG国際会議で報告した。1999年度のTR原案作成を目標として検討を継続している。

4.2.4 SMIL 1.0

SMIL(Synchronized Multimedia Integration Language[W3C Rec.]) 1.0の翻訳を完成し, 標準情報(TR)原案として2月に工業技術院に提出した。

NOTE: SMILとは

独立したマルチメディアオブジェクトを同期型のマルチメディアプレゼンテーションに統合するため, SMIL要素をXMLのシンタクスを用いて定義し, SMILで使用する時間モデルを定義する。

4.2.5 DOM 1

1998年10月1日にDOM(Document Object Model) 水準1のW3C Rec.がW3Cから公表されたので, 分担を決めて翻訳作業に着手した。1998年度末のTR素案完成を目標とする。

NOTE: DOMとは

プログラムによって文書(XML文書, HTML文書)の構造, 内容, スタイルシートを参照, 変更するためのプログラムインタフェースを規定する。

4.2.6 RDF

1998/07版対応のRDF(Resource Description Format) Model and Syntaxの素訳を完成した。W3CにおけるWD編集作業が継続中なので, 今年度の翻訳(TR素案)は報告書に掲載するにとどめ, TR原案提出は1999年度とする。

NOTE: RDFとは

メタデータを記述するための枠組みであり, 特にWeb上の機械可読情報を交換するアプリケーション間の相互運用を目的として, W3Cが, モデル, シンタクス, スキーマを開発している。

Webページを利用者に自動配送するウェブキャスティングには, プッシュ形モデルによるページ配送が行われる。つまりサーバがメタデータを保持し, それがブラウザに送られる。ブラウザはメタデータを解釈し, そこに指定された時間間隔でWebページを要求する。

CDF(Channel Definition Format)を用いてこのプッシュ形モデルによるページ配送をおこなっている例として, IE 4.0, PointCast Network 2.0がある。W3Cではさらに一般的なメタデータ記述の枠組みを目指し, 1997年からRDFの開発を行なってきた。その表現形式にはXMLが採用されている。

4.2.7 TR X 0008改正原案

1997年12月版の翻訳は, 標準情報 TR X 0008:1998として, 1998年5月1日に公表された。W3Cは, 1997年12月版に対するコメントへの回答を1998年2月10日に公開し, それを反映して変更を加えたW3Cの勧告"Extensible Markup Language (XML) 1.0"を1998年2月10日に発行した。それに対しては, TR X 0008:1998の利用者をも含む多くの利用者からコメントがW3Cに提出され, 正誤表が公開されている。

そこで, XML1998/02版対応のTR X 0008改正原案の作成を行い, XML1998/02版に対するerratumをW3Cが1998/11に公表することを明らかにしたので, そのerratumを反映したTR X 0008改正原案を1999年2月に完成した。

4.2.8 XML日本語プロファイル

TR X 0008の解説に含めていたXML日本語プロファイルの改訂更新作業を継続している。これをTR X 0008改正原案から分離して独立のTRとするための編集作業を行ない, TR原案を1999年2月に完成した。その公表の後, その内容を国際(W3C)に提案するストラテジについて検討を行った。

XML 1.0は,符号化文字集合としてJIS X 0221及びUnicode 2.0を採用しており,これは日本語文字をすべて含む。文字符号化スキームとしてはUTF-8及びUTF-16を推奨し,これらの実装を義務づけている。既存の文字符号化スキームも,Unicode 2.0の文字だけを扱う限りオプションとしてすべて許容している。

しかし,XML 1.0では,日本語文字の交換に広く使われてきた既存の文字符号化スキームはほとんど説明されてなく,オプションの一つとして許容されているに過ぎない。SMTP及びHTTPなどのプロトコル並びに情報交換用ファイルで,どの文字符号化スキームを用いるかについても,特に定められてはいない。既存の文字符号化スキームとJIS X 0221及びUnicode 2.0との対応も不明確である。相互に異なるいくつかの変換表が用いらており,複数のXMLプロセサが異なる結果を出力する場合がある。

これらの問題点を明確にするため,この標準情報(TR)は文字符号化スキームについての明確化を行っている。

備考 本件の議論に関連し, XML/SWGは, XML/SWG主査から符号化文字集合のJIS第三水準,第四水準を検討している委員会に次のコメントを送った。

From: Murata Makoto <makoto@mars.netspace.or.jp>
Date: Sat, 26 Dec 1998 02:48:00 +0900
To: new-jis@jcs.aa.tufs.ac.jp


JCS WG2御中、

XMLを始めとするW3Cの仕様を扱うINSTAC XML SWGからのコメントをお送り
致します。

規格案のコメント・提案該当個所: 適用範囲、附属書1, 附属書2

住所:213-0012 川崎市高津区坂戸3-2-1 KSP 9A7 FXIS DPSD
氏名:INSTAC XML SWG主査  村田真 (murata@apsdc.ksp.fujixerox.co.jp)
所属:富士ゼロックス情報システム(株)
電話番号:044-812-7230

------------------
「7ビット及び8ビットの2バイト情報交換用符号化拡張漢字集合(案)」へ
のコメント

平成10年12月25日

INSTAC XML SWG

1. 文字レパートリーの拡張について

WebとInternetの仕様を制定するW3CとIETFは、どちらもUnicodeを基盤として
国際化を進めています。XMLを初めとして、HTML, RDF, DOM, XSL, CSSなどの
仕様はすべてUnicodeまたはISO/IEC 10646をもとにして設計されています。
IETFにおける国際化のガイドラインであるRFC2130, RFC2277でも、Unicodeま
たはISO/IEC 10646を基準としています。

まず、UnicodeまたはISO/IEC 10646に文字を追加する提案を行い、それが通っ
たあとでJIS規格を制定すべきです。JIS規格だけを先行して制定すれば、Web
およびインターネットで使える日本語文字と、JIS規格準拠ソフトウェアで使
える日本語文字とが異なるという事態を招く危険性があります。

なお、変換を行えばよいという意見もあるでしょうが、実際には変換表を確定
することは困難です。すでに、Unicode以前からあったJIS X 0208に関してさ
え、JIS X0221の附属書3「JIS X 0201, JIS X 0208及びJIS X 0212の表内文字
との対応」と、Unicode consortiumから公開されている変換表とで、一文字だ
け異なる(U+2014とU+2015)という問題が発生しています。


2. 符号化方法について

1) UTF-8, UTF-16, UCS-4の推進

将来はUTF-8, UTF-16, UCS-4に移行していくべきです。これらを推進するとい
う立場から、既存の符号化方法を拡張することは好ましくありません。

2) シフトJISの拡張

RFC 2046は、US-ASCIIの変種をインターネットで使用することを"explicitly
discourage"しています。この規定に従えば、JIS X 0201を用いているシフト
JISは、インターネットで使用すべきではありません。このような符号化方式
を拡張して延命させることは、メリットよりデメリットの方が大きいでしょう。

なお、シフトJISには、IANAにおけるShift_JISの登録がJIS X 0208:1997を参
照していないという問題もあります。

備考: PCにおいても、シフトジスからUnicodeへの移行は始まっており、perl,
Java, 一太郎, MS-Word, Windows NT, Windows 98などの最新のアプリケーショ
ンはUnicodeに基づいています。これらのアプリケーションでは、Unicodeに入っ
ていない文字は扱えません。DVDやCDRが準拠しているUniversal Disk File
System(ISO 13346に基づくプロファイル)も、Unicodeに基づいています。した
がって、シフトJISを中心におくことは、相互運用性を阻害し、今後の国際的
な技術動向に反しています。

3) ISO-2022-JP-3

ISO-2022-JPは、IETFにおけるRFC1468, JIS X 0208:1997の附属書1、RFC1468
を置き換える予定のInternet
Draft(draft-yamamoto-charset-iso-2022-jp-01.txt)の三つの定義があります。
これらの整合を行うことなしに、新たにISO-2022-JP-3を導入することは混乱
を助長します。

参考文献

IANA(Internet Assigned Numbers Authority). Official Names for
Character Sets, ed. Keld Simonsen et al.
ftp://ftp.isi.edu/in-notes/iana/assignments/character-sets

IETF (Internet Engineering Task Force).  RFC 1468: Japanese
character encoding for Internet messages, ed. J. Murai,
M. Crispin, and E. van der Poel.  1993.

IETF (Internet Engineering Task Force).  RFC 2046:
Multipurpose Internet Mail Extensions (MIME) Part Two: Media
Types, ed. N. Freed and N. Borenstein.  1996.

IETF (Internet Engineering Task Force).  RFC 2130: The
report of the IAB Character Set Workshop held 29 February ---
1 March, 1996, ed.  C. Weider, C. Preston, K. Simonsen,
H. Alvestrand, R. Atkinson, M. Crispin, and
P. Svanberg. 1997.

IETF (Internet Engineering Task Force).  RFC 2277: IETF
policy on character sets and languages, ed. H. Alvestrand.
1998.

Japanese Character Encoding for Internet Messages,
ed. E. Wada, J. Murai, and K. Yamamoto
ftp://ftp.isi.edu/internet-drafts/draft-yamamoto-charset-iso-2022-jp-01.txt

村田  真

4.3 成果

4.3.1 TR X 0005改正原案

TR X 0005改正原案を1998年11月に工業技術院に提出した。その中の今年度の翻訳作業の成果であるEJB 1.0の翻訳原案を附属資料 Aに示す。

4.3.2 SMIL 1.0

1999年2月に工業技術院に提出したSMIL 1.0に関するTR原案を附属資料 Bに示す。

4.3.3 DOM 1

DOM 水準1の翻訳素案の1999年2月版を附属資料 Cに示す。

4.3.4 RDF

RDF Model and Syntaxの翻訳素案の1999年2月版を附属資料 Dに示す。

4.3.5 TR X 0008改正原案

1999年2月に工業技術院に提出したTR X 0008改正原案を附属資料 Eに示す。

4.3.6 XML日本語プロファイル

1999年2月に工業技術院に提出したXML日本語プロファイルのTR原案を附属資料 Fに示す。

4.4 次年度の課題

1999年度には次の課題について作業を行う。