« 2005年12月18日 | メイン | 2005年12月20日 »
2005年12月19日
ブラウザで表示できる文字符号化の例
インターネットのWebで、日本にいながらにして世界中の国のホームページを見ることができます。実際に各国の文字を見る機会は、PDFよりもブラウザを使っての方が多いかもしれませんね。
インターネット用ブラウザは、世界中の文字を表示できるようになっています。その中で、最近話題のMozilla Firefoxをチェックしてみましょう。
Firefoxでは、文字の符号化方式を自動的に判別できるようになっています。(Firefoxに限らず、電子メールソフトなどでも同じです。)しかし、もし正しく判別できなかった場合に備えて、自分でも文字符号化方式を選択できるようになっています。
文字符号化をCharacter Encodingといいますが、Firefoxでは文字エンコードメニューで符号化方式を選択します。自分で文字符号化を指定するメニューでは、次の符号化方式がリストされています。
地域 | 符号化方式 | 日本語メニュー |
---|---|---|
西欧 | 西欧ISO-8859-1 | |
西欧ISO-8859-15 | ||
西欧IBM-850 | ||
西欧MacRoman | ||
西欧Windows-1252 | ||
ケルト語ISO-8859-14 | ||
ギリシャ語ISO-8859-7 | ||
ギリシャ語MacGreek | ||
ギリシャ語Windows-1253 | ||
アイスランド語MacIcelandic | ||
北欧ISO-8859-10 | ||
南欧ISO-8859-3 | ||
東欧 | バルト語ISO-8859-4 | |
バルト語ISO-8859-13 | ||
バルト語Windows-1257 | ||
中欧IBM-852 | ||
中欧ISO-8859-2 | ||
中欧MacCE | ||
中欧Windows-1250 | ||
クロアチア語MacCroatioan | ||
キリル文字IBM-855 | ||
キリル文字ISO-8859-5 | ||
キリル文字ISO-IR-111 | ||
キリル文字KOI8-R | ||
キリル文字MacCyrillic | ||
キリル文字Windows-1251 | ||
キリル文字/ロシア語CP-866 | ||
キリル文字/ウクライナ語KOI8-U | ||
キリル文字/ウクライナ語MacUkrainian | ||
ルーマニア語ISO-8859-16 | ||
ルーマニア語MacRomanian | ||
東アジア | 簡体字中国語GB2312 | |
簡体字中国語GBK | ||
簡体字中国語GB18030 | ||
簡体字中国語HZ | ||
簡体字中国語ISO-2022-CN | ||
繁体字中国語Big5 | ||
繁体字中国語Big-HKSCS | ||
繁体字中国語EUC-TW | ||
日本語EUC-JP | ||
日本語ISO-2022-JP | ||
日本語Shift_JIS | ||
韓国語EUC-KR | ||
韓国語UHC | ||
韓国語JOHAB | ||
韓国語ISO-2022-KR | ||
西南・東南アジア | アルメニア語ARMSCII-8 | |
グルジア語GEOSTD8 | ||
タイ語TIS-620 | ||
タイ語ISO-8859-11 | ||
タイ語Windows-874 | ||
トルコ語IBM-857 | ||
トルコ語ISO-8859-9 | ||
トルコ語MacTurkish | ||
トルコ語Windows-1254 | ||
ベトナム語TCVN | ||
ベトナム語VISCII | ||
ベトナム語VPS | ||
ベトナム語Windows-1258 | ||
ヒンディー語MacDevanagari | ||
グジャラート語MacGujarati | ||
グルムキー語MacGurmukhi | ||
中近東 | アラビア語ISO-8859-6 | |
アラビア語Windows-1256 | ||
アラビア語IBM-864 | ||
アラビア語MacArabic | ||
ペルシャ語MacFarsi | ||
ヘブライ語ISO-8859-8-I | ||
ヘブライ語Windows-1255 | ||
ヘブライ語ISO-8859-8 | ||
ヘブライ語IBM-862 | ||
ヘブライ語MacHebrew |
これを見て気がつくのは、ISOなどの標準規格の他に、IBM、Macintosh、Windowsの名前を冠したメーカ定義の符号化方式もあるということです。このように、メーカが独自に文字符号化を定義しなければならなかったのは、旧来の文字規格では、標準化されている文字の種類がすくなく、各メーカがユーザの要望に応じて独自の文字を追加していたためです。
なお、Firefox(特に、日本語訳)では、言語と文字符号化方式をあまり厳密に使い分けていないようですね。
投票をお願いいたします