« 2007年12月21日 | メイン | 2007年12月23日 »

2007年12月22日

第10回 XML開発者の日(1)

21日は第10回XML開発者の日。去年より1ヶ月ほど遅く、暮れの押し迫った季節で忙しかったのですが、1日参加してきました。(来年は、もう少し早めに開催してほしいな)。

プログラム:http://www.asahi-net.or.jp/~eb2m-mrt/kaihatsu10.html

今回は、どうもジャストシステムのプレゼンテーション・デイのようで、半分位xfyとジャストの技術・製品の宣伝だったように思います。

昨年は、宮川さんのPlaggerのプレゼンなどがあって盛り上がりました。今年は、それに比べて、やや目新しさに掛けたようですが、XML技術というのは、それ自体として色々な技術的な挑戦とそれを使った新しい応用があってとても面白いものだと思います。少なくとも文字コードなどよりは面白いでしょう。

で、面白くない方の文字コード関係では、アドビの山本さんによるAdobe-Japan1-6をUnicodeのUTS 37 Ideographic Variation Databaseに登録したという話に、実務的にですが、関心をもちました。

このUTS 37は、もともとは漢字の異体字を登録して使うための仕様として2005年に提案されて、2006年1月に正式な仕様となっていました。要するに、Unicodeにコードポイントのある文字を例えば、U+82A6としますと、その異体字に対してE0100~E01EFまでの240のインデックスを付加することで識別可能とするものです。

今回Adobeが初めて、この仕様をつかって、Adobe-Japan1-6の中の字形を登録したとのことです。

登録された字形とコードはこちらに公開されています。まだ、登録ほやほやで12月14日付けです。
Ideographic Variation Database

例えば、<82A6 E0100> が、Adobe-Japan1-6 のCID+1142に、<82A6 E0101>が同CID+7961に対応します。

ここに登録された文字を使うUnicodeテキストには、E0100~E01EFのコードが含まれます。従って、アプリケーションは、Unicodeテキストのこの部分を解釈して、それなりのグリフに対応つける必要があることになります(最悪、E0100~E01EFを削除する)。このようなコードが普及する前に、Unicodeテキストを処理するアプリケーションの改造が必要になります。

Adobe-Japan1-6の字形が登録されてしまった以上、今後、他のフォントベンダーなり、他のメーカは、各Unicodeのコードポイントに付随するインデックスであるE0100~E01EFに異なる字形を割り当てることができなくなると思います。

このあたりは、PRをしっかりやって、他のフォント・ベンダ等も協調をとっていただきたいものです。そうしないと、Unicodeテキストをグリフにマップする過程で、字形が思わぬものに置き換わる可能性があります。

投票をお願いいたします

投稿者 koba : 08:00 | コメント (0) | トラックバック