« Windows Vista と日本語文字コード問題(2) | メイン | Windows Vista と日本語文字コード問題(4) »
2007年01月06日
Windows Vista と日本語文字コード問題(3)
JIS X0213の付属書4に、仮名、特殊文字および罫線素片についてのUnicodeとの対応表があります。
これの2004年版を見ますと、JIS X0213では一文字になっているのに、Unicodeでは二つの文字の並びで表すようになっている文字が25文字あります。
これらの文字はUnicodeでは1つのコードポイントが与えられていないため、次の図のように2つのコードポイントの文字(または記号)を合成して表さなければなりません。
図1 文字を結合する仕組み
※以前(下記、参考の日付)にUnicodeの結合文字のお話をしましたので、この仕組みについて詳しくはそちらも参考にしてください。
これらの文字をUnicodeで表すには、基底文字と結合文字のセットで表すしか方法がないということなのです。具体的な文字の一覧を図2に示しました。
図2 JIS X0213 に1文字で定義されているがUnicodeにはコードポイントがない文字
【参考】
Unicodeの結合文字については、こちらを参照してください。
・2006年01月27日 PDFと文字 (34) – Unicodeの結合文字
・2006年01月28日 PDFと文字 (35) – 文字の合成方法
・2006年01月29日 PDFと文字 (36) – 文字の合成方法(続き)
・2006年01月30日 PDFと文字 (37) – 結合文字列の正規合成
投稿者 koba : 2007年01月06日 08:00
トラックバック
このエントリーのトラックバックURL:
http://blog.antenna.co.jp/PDFTool/mt-tbng2.cgi/558
このリストは、次のエントリーを参照しています: Windows Vista と日本語文字コード問題(3):
» JIS2004 関連 from かるあ のメモ
1/30日 の codeseek の勉強会で 亀川さん の文字コードのお話を聞いて、気になったので少し調べてみた。
今回検索してみて、検索し始めるときりがない... [続きを読む]
トラックバック時刻: 2007年02月01日 22:13