« 2005年12月18日 | メイン | 2005年12月20日 »

2005年12月19日

ブラウザで表示できる文字符号化の例

インターネットのWebで、日本にいながらにして世界中の国のホームページを見ることができます。実際に各国の文字を見る機会は、PDFよりもブラウザを使っての方が多いかもしれませんね。

インターネット用ブラウザは、世界中の文字を表示できるようになっています。その中で、最近話題のMozilla Firefoxをチェックしてみましょう。

Firefoxでは、文字の符号化方式を自動的に判別できるようになっています。(Firefoxに限らず、電子メールソフトなどでも同じです。)しかし、もし正しく判別できなかった場合に備えて、自分でも文字符号化方式を選択できるようになっています。

文字符号化をCharacter Encodingといいますが、Firefoxでは文字エンコードメニューで符号化方式を選択します。自分で文字符号化を指定するメニューでは、次の符号化方式がリストされています。

地域 符号化方式 日本語メニュー
西欧WestEuropeE.PNG 西欧ISO-8859-1
西欧ISO-8859-15
西欧IBM-850
西欧MacRoman
西欧Windows-1252
ケルト語ISO-8859-14
ギリシャ語ISO-8859-7
ギリシャ語MacGreek
ギリシャ語Windows-1253
アイスランド語MacIcelandic
北欧ISO-8859-10
南欧ISO-8859-3
東欧 EastEuropeE.PNG バルト語ISO-8859-4
バルト語ISO-8859-13
バルト語Windows-1257
中欧IBM-852
中欧ISO-8859-2
中欧MacCE
中欧Windows-1250
クロアチア語MacCroatioan
キリル文字IBM-855
キリル文字ISO-8859-5
キリル文字ISO-IR-111
キリル文字KOI8-R
キリル文字MacCyrillic
キリル文字Windows-1251
キリル文字/ロシア語CP-866
キリル文字/ウクライナ語KOI8-U
キリル文字/ウクライナ語MacUkrainian
ルーマニア語ISO-8859-16
ルーマニア語MacRomanian
東アジアEastAsiaE.PNG 簡体字中国語GB2312
簡体字中国語GBK
簡体字中国語GB18030
簡体字中国語HZ
簡体字中国語ISO-2022-CN
繁体字中国語Big5
繁体字中国語Big-HKSCS
繁体字中国語EUC-TW
日本語EUC-JP
日本語ISO-2022-JP
日本語Shift_JIS
韓国語EUC-KR
韓国語UHC
韓国語JOHAB
韓国語ISO-2022-KR
西南・東南アジア SESWAsiaE.PNG アルメニア語ARMSCII-8
グルジア語GEOSTD8
タイ語TIS-620
タイ語ISO-8859-11
タイ語Windows-874
トルコ語IBM-857
トルコ語ISO-8859-9
トルコ語MacTurkish
トルコ語Windows-1254
ベトナム語TCVN
ベトナム語VISCII
ベトナム語VPS
ベトナム語Windows-1258
ヒンディー語MacDevanagari
グジャラート語MacGujarati
グルムキー語MacGurmukhi
中近東MiddleEasternE.PNG アラビア語ISO-8859-6
アラビア語Windows-1256
アラビア語IBM-864
アラビア語MacArabic
ペルシャ語MacFarsi
ヘブライ語ISO-8859-8-I
ヘブライ語Windows-1255
ヘブライ語ISO-8859-8
ヘブライ語IBM-862
ヘブライ語MacHebrew
※Firefoxのバージョン:英語版は1.0.6、日本語版は1.0.

これを見て気がつくのは、ISOなどの標準規格の他に、IBM、Macintosh、Windowsの名前を冠したメーカ定義の符号化方式もあるということです。このように、メーカが独自に文字符号化を定義しなければならなかったのは、旧来の文字規格では、標準化されている文字の種類がすくなく、各メーカがユーザの要望に応じて独自の文字を追加していたためです。

なお、Firefox(特に、日本語訳)では、言語と文字符号化方式をあまり厳密に使い分けていないようですね。

投票をお願いいたします

投稿者 koba : 08:00 | コメント (1) | トラックバック