« 9月7日 X-over Development Conferenceに参加 | メイン | PDFと長期署名(11) — ECOM提案のPDF/A長期署名 »

2007年07月31日

PDFと長期署名(10) — PDF/A 仕様 8 タグ付きPDF

PDF/Aの最後の要求項目はPDF内に文書を構造化するタグをつけることです。但し、これは、PDF/A-1aのみの要求項目であり、PDF/A-1bでは要求されません。

タグ付きPDFの機能は、普通は、アクセシビリティの要求項目と考えられています。つまり、PDFを画面に表示して、スクリーンリーダなどで読み上げるとき、その読み上げ順序を正しいものにするためです。PDFの音声読み上げで困るのは、PDFの中に入っている読み上げ対象の文字列が、読み上げたい順序で入っていないことがあることです。それから画像などは読み上げ出来ませんので、代替文字列を入れておき、それを読み上げることになります。

アンテナハウスのXSL FormatterV4.0以降はこのタグ付きPDFを出力することができます。Formatterの製品説明のWebページにタグ付きPDFの機能についての詳しい説明があります。

http://www.antenna.co.jp/XSL-FO/V4/pdf.htm
のタグ付きPDFの項を参照してください。

XSL Formatterの場合、オリジナル組版対象データはXMLであり、それをXSL-FOというスタイル指定されたXMLに変換していますので、元の文書に構造があり、比較的容易にタグ付きPDFの要求する構造化タグをPDFに埋め込むことができます。

また、画像ファイルへの代替文字列、テキスト言語の指定などの要求もオリジナルデータがそのように作ってあれば問題なく対応できます。

しかし、通常のオフィス・アプリケーションで作成した文書をタグ付きPDFに出力するのは、もともとオリジナルに構造がないだけに難しいものがあります。「Wordでタグ付きPDFをうまく作る方法」なんてセミナーがあるくらいです。

そういった難しさがあるために要求水準の高いPDF/A-1aに分類されているのでしょう。

PDF/Aの仕様書によりますと、タグ付きPDFの要求の部分には次のようなことが書いてあります。

6.8 論理構造
・タグ付きPDFの要求の意図は、適合するPDFのファイルのテキストの意味を回復するとき、言語の自然な読み順に定義されるような語句の並びになることを保証すること。
・さらに、文書の論理構造に関して、高度なレベルの意味的な情報を回復できること。

そして、さらに次の注意があります。

・PDF/A-1aを作成するソフトは、オリジナルの文書に明示的または暗黙に存在しない構造または意味的な情報を、PDF/A-1aに適合させる、という目的のみで付加してはならない。
・適切な検証をしないまま、自動的なプロセスで、構造的または意味的な情報を生成するのは薦めることができない。

つまり、タグ付きPDFを自動的に生成して、それがPDF/A-1aに準拠すると主張するためには、元の文書自体に構造がなければならない、ということを言っています。

もとの文書の構造がないときは、手作業などでPDFにタグを埋めて行く必要がありそうです。

投稿者 koba : 2007年07月31日 08:00

トラックバック

このエントリーのトラックバックURL:
http://blog.antenna.co.jp/PDFTool/mt-tbng2.cgi/765

コメント

コメントしてください




保存しますか?