« 2007年01月05日 | メイン | 2007年01月07日 »
2007年01月06日
Windows Vista と日本語文字コード問題(3)
JIS X0213の付属書4に、仮名、特殊文字および罫線素片についてのUnicodeとの対応表があります。
これの2004年版を見ますと、JIS X0213では一文字になっているのに、Unicodeでは二つの文字の並びで表すようになっている文字が25文字あります。
これらの文字はUnicodeでは1つのコードポイントが与えられていないため、次の図のように2つのコードポイントの文字(または記号)を合成して表さなければなりません。
図1 文字を結合する仕組み
※以前(下記、参考の日付)にUnicodeの結合文字のお話をしましたので、この仕組みについて詳しくはそちらも参考にしてください。
これらの文字をUnicodeで表すには、基底文字と結合文字のセットで表すしか方法がないということなのです。具体的な文字の一覧を図2に示しました。
図2 JIS X0213 に1文字で定義されているがUnicodeにはコードポイントがない文字
【参考】
Unicodeの結合文字については、こちらを参照してください。
・2006年01月27日 PDFと文字 (34) – Unicodeの結合文字
・2006年01月28日 PDFと文字 (35) – 文字の合成方法
・2006年01月29日 PDFと文字 (36) – 文字の合成方法(続き)
・2006年01月30日 PDFと文字 (37) – 結合文字列の正規合成