« PDFについてのQ&A — フォント埋め込みについて | メイン | PDFについてのQ&A — フォント埋め込みについて(基本の説明) »

2007年06月23日

PDFについてのQ&A — フォント埋め込みについて(続き)

昨日のお話は、フォントを埋め込まないと問題がでることがある、ということでしたが、以前に、フォントを埋め込む場合とフォントを埋め込まない場合についてPDFのデータが違うことをお話したことがあります。

2007年01月22日 日本語の文字についての用語について(9) — PDFへのフォント埋め込みとは — PDFに文字を埋め込まない場合は、PDFの中のテキストは文字コードで表現されていますが、PDFに文字を埋め込んだ場合は、PDFの中のテキストはグリフのIDとグリフデータ(グリフIDに一対一対応)で表されていることを説明しています。

この違いを理解するには、文字コードとグリフ(グリフのID、グリフデータ)という言葉についての知識が必要です。これにつきましても既にお話しています。

まず、文字コードは、コンピュータで文字を取り扱うために、文字を集めて抽象的な集合を作成してその構成単位に番号をつけたものです。構成単位は抽象的な文字であって、それを可視化・具象化したものが実際に画面に表示したり紙に印刷される文字となります。

日本語の場合、ひとつの文字コード(コードポイント)に対して対応付けられる、可視化される文字の形は一つだけではありません。これについては、2007年01月17日 日本語の文字についての用語について(5) — 3階層モデルなどで説明しました。

ここで、字体とは、文字骨格であり、字形とは文字の具体的な形です。

2007年01月11日 日本語の文字についての用語について(1)

コンピュータの上で、文字を可視化する方法は幾つかありますが、現在、一般的なアウトライン・フォントの場合、字形は、フォントのグリフデータとして用意されています。これについては2006年04月24日PDFとフォント(15) アウトラインフォントなどでお話しています。

PDFにフォントが埋め込まれていない場合、PDFの中には文字コード(コードポイント)の並びがあり、その文字コードを表示するために使うフォント・ファミリーが指定されています。そこで、その文字を実際に、画面に表示する前に、次の手続きが必要です。

(1)PDF中で指定されているフォント・ファミリーを、PDFを表示する環境であるPCに存在するフォント・ファミリーに対応付けする。同一のフォント・ファミリーが存在すれば問題ないが、存在しないと別のフォント・ファミリーの中で適切なものを決定する。
(2)フォント・ファミリーの中で、コードポイント⇒グリフIDに対応つける。
(3)当該のグリフIDに対応するグリフデータを使って文字を可視化する。

上のステップで特に、(2)、(3)の点について、2007年01月21日 日本語の文字についての用語について(8) — 文字コードとフォントなどでお話しています。つまり、同じコードポイントに対応付けられるグリフデータは一つとは限らないということです。

PDFにフォントを埋め込まないときは、あるコードポイントの文字を可視化するのに、上のような過程を踏むことになりますので最終的に可視化される文字が、偶に、意図しない文字になることがありそうなことは想像が付くと思います。

投稿者 koba : 2007年06月23日 08:00

トラックバック

このエントリーのトラックバックURL:
http://blog.antenna.co.jp/PDFTool/mt-tbng2.cgi/727

コメント

コメントしてください




保存しますか?