TOP | BACK | FORW


4. XML日本語プロファイル

4.1 TR X 0015:1999



XMLは,符号化文字集合としてJIS X 0221及びUnicode 2.0を採用しており,これは日本語文字をすべて含む。文字符号化スキームとしてはUTF-8及びUTF-16を推奨し,これらの実装を義務付けている。既存の文字符号化スキームも,Unicode 2.0の文字だけを扱う限りオプションとしてすべて許容している。

しかし,XMLの勧告では,日本語文字の交換に広く使われてきた既存の文字符号化スキームはほとんど説明されてなく,オプションの一つとして許容されているに過ぎない。SMTP及びHTTPなどのプロトコル並びに情報交換用ファイルで,どの文字符号化スキームを用いるかについても,特に定められてはいない。

既存の文字符号化スキームとJIS X 0221及びUnicode 2.0との対応も不明確である。相互に異なるいくつかの変換表が用いらており,複数のXMLプロセサが異なる結果を出力する場合がある。

これらの問題点を明確にするため,TR X 0008:1998はその解説の中に, "3. 日本語プロファイル"を設けて, 全角英数字及び半角片仮名, 情報交換用ファイル中のXML文書, HTTPによるXML文書の配送, メールによるXML文書の配送などに関する記述を含めている。

TR X 0008:1998を改正してTR X 0008:1999の原案を作成する際, 原案委員会である"高速Webにおける標準化に関する調査研究委員会"の作業グループ(WG3/XML-SWG)はこの問題の重要性を再確認して, この日本語プロファイルを独立した標準情報(TR)とすることにした。TR原案は99年2月に提出され[5], TR X 0015:1999, XML日本語プロファイル として99年5月に公表された。



TOP | BACK | FORW