« 2007年07月22日 | メイン | 2007年07月24日 »

2007年07月23日

PDFと長期署名(3) — PDF/A 仕様

PDFは、その名前Portable Document Formatの意味するとことからも明確なように、アプリケーションから独立した電子ファイルの形式として設計されています。Mac OS XのようにOSレベルでPDFをサポートしている場合もあります。ですので、PDFファイルはハードウエアやOSを超えて可視化されることができる点で、Microsoft OfficeやOpenOffice.orgで作成した文書などと比べて非常に有利です。

しかし、一方において、PDFはものすごく豊富な機能をもっています。その中には、電子ドキュメントを長期にわたって保管するという点からは、使用しないほうが良い機能も多数あります。例えば、暗号化によるセキュリティ設定などはその典型的な例でしょう。PDFファイルを暗号化しますと、暗号のための鍵の管理が重大な課題になります。5年、10年、20年経過したときに、もし、暗号の鍵の所在が分からなくなってしまえば、そのPDFの内容を可視化することは極めて難しくなるでしょう。

また、PDFは仕様が公開されており、誰がPDFソフトを作っても良いとされていることから、非常に多くの開発者がPDFのソフトを作っています。

Adobe(ヨーロッパ)の標準ビジネス部門長 Marc Straat氏が2006年12月に行ったプレゼンの資料をみましたら、「Community of nearly 2000 PDF tool developers」とありました。PDFツールの開発者は2000人もいるのだそうです。こうした様々な開発者が作成したPDFが、それぞれ、独自の挙動を示してしまう、という問題も指摘されています。

参考資料
PDF/A — Format — Status and Practical Experiences

こうした観点から、PDFを長期に保管するためにPDF1.4仕様をもとに、そこにある機能について、必ず設定しなければならないものと、使ってはいけない、あるいは制限付きで使うべきことをまとめたものがPDF/Aです。

PDF/Aについては、「PDF千夜一夜」の中で、既に概要は紹介しています。しかし、今回は、もう少し詳しく、ISOの仕様書を読みながら解説してみたいと思います。

1.PDF/A仕様の意図

PDF/A仕様の意図として、ISO 15009-1の仕様書は次のように述べています。

「PDFは重要な情報を表現するために使われますが、これらの情報には相当な長期にわたって維持されるもの、一部には永久に保存されるものがあります。これらのPDFファイルは多数の技術的世代を跨って、利用可能でなければなりません。」

PDF/Aの目標として、3点を掲げています。

* 作成・蓄積・可視化ツールから独立で、時間がたってもビジュアルな見かけを維持できること。
* 電子文書の文脈と履歴をメタデータの中に残すことができること。
* 電子文書の論理的な構造と意味に関する情報を残すこと。

ところで長期的とはどの程度なんでしょうか?ISOの仕様書には「長期的」という言葉を次のように定義しています。

"period of time long enough for there to be concern about the impacts of changing technologies..略 .. and of a changing user community, on the information being held in a repository, which may extend into the indefinite future"

つまり、技術の変化、ユーザコミュニティの変化が、保管されている情報に対して与える影響について懸念されるほど、の長い期間ということです。先日の国会図書館のケースを見ましても、PDF/Aがターゲットとする長期は、かなり長いということがいえると思います。

投票をお願いいたします

投稿者 koba : 00:00 | コメント (0) | トラックバック