« 2007年02月06日 | メイン | 2007年02月08日 »
2007年02月07日
テキストファイル考(2) — データ交換形式としてのテキスト
昨日のお話は、取り扱うデータの種類という観点でのものです。
これらデータは、コンピュータ内部では、すべてバイナリ(0-1の組合せ)で取り扱われます。さて、それを、コンピュータの外部に出して交換するときはどうするかということですが、そのときもまた、テキスト系とバイナリ系という分類ができます。一応、これらに、テキストシーケンスとバイナリシーケンスという言葉を当てはめて見ましょう。
次の図のようになります。
【お詫び】この図誤っていましたので、2月11日に差し替えました。
注意していただきたいのですが、扱うデータがバイナリ系かテキスト系かということと、外部交換形式としてのテキストシーケンスとバイナリシーケンスかということは、1対1対応ではありません。次の図をご覧ください。
インターネット以前のパソコン通信では、バイナリファイルやテキストファイルを圧縮して、圧縮したファイルをIshでASCII文字のみのテキストに変換してデータを送受信していたものです。これは、通信路やソフトウェアの中に、ASCII文字のみのテキストしかうまく通さないようになっている箇所があったためです。
投票をお願いいたします