« 2007年02月06日 | メイン | 2007年02月08日 »

2007年02月07日

テキストファイル考(2) — データ交換形式としてのテキスト

昨日のお話は、取り扱うデータの種類という観点でのものです。

これらデータは、コンピュータ内部では、すべてバイナリ(0-1の組合せ)で取り扱われます。さて、それを、コンピュータの外部に出して交換するときはどうするかということですが、そのときもまた、テキスト系とバイナリ系という分類ができます。一応、これらに、テキストシーケンスとバイナリシーケンスという言葉を当てはめて見ましょう。

次の図のようになります。
20060706-3.PNG
【お詫び】この図誤っていましたので、2月11日に差し替えました。

注意していただきたいのですが、扱うデータがバイナリ系かテキスト系かということと、外部交換形式としてのテキストシーケンスとバイナリシーケンスかということは、1対1対応ではありません。次の図をご覧ください。

20070206-4.PNG

インターネット以前のパソコン通信では、バイナリファイルやテキストファイルを圧縮して、圧縮したファイルをIshでASCII文字のみのテキストに変換してデータを送受信していたものです。これは、通信路やソフトウェアの中に、ASCII文字のみのテキストしかうまく通さないようになっている箇所があったためです。

20070206-5.PNG

投票をお願いいたします

投稿者 koba : 08:00 | コメント (0) | トラックバック