タグ別アーカイブ: PDF仕様

Next Generation PDF について(2)

Core concepts and use cases

キーノートでは詳しいことが分からなかったので、このセッションのスライドを読んでみました。

ここでは「next-generation PDF」を処理する「next-generation processor」という用語が出てきます。その役割は「タグ付きPDFからの導出(Derivation):PDF コンテンツを HTML で表現するための標準化されたモデル」と書かれています。
どうやら、HTML にうまく変換できるような標準化されたタグ付けのモデルとその変換アルゴリズムを定めて、予測可能で互換性のある方法で HTML に変換しよう、ということのようです。

そして、HTML に変換してから端末に応じたスタイルシートを適用することで、既にモバイル環境に対応した Web のテクノロジーを利用して、PDF のコンテンツをモバイル環境で利用できるようにする、という目論見のようです。

PDF から HTML に変換する製品は現時点でも既にあるようで、後のセッションでも紹介があります。標準化された方法でより正確に出来ることを目指そうということでしょうか。

また、ユースケースでは、アクセシビリティの観点からの解説がありました。

U.S. や EU 等の政府機関ではアクセシビリティが要求されますが、既存のスクリーンリーダーなどの Assistive Technology(障害を持つ人々を支援する機器や技術)は HTML をサポートするが、PDF はほとんどサポートされない状況があります。一方で PDF は電子文書としての信頼性と互換性が確立されているので、政府機関は PDF を諦めたくはない。

アクセシビリティの準拠基準は、W3C の WCAG (Web Content Accessibility Guidelines) 規格の達成基準レベル「AA」を条件として示されるようですが、この規格は Web を前提としたもので HTML には適用しやすいが、PDF には直接的に適用しにくいので、PDF が HTML として表現できれば WCAG への適合を判定しやすい、ということが説明されています。

今後 PDF がどのように発展していくのか。「PDF Day Europe 2017」での動向をご紹介しました。参考になれば幸いです。

<< その(1)


Next Generation PDF について(1)

5月15, 16日にドイツのベルリンで開催されたイベント「PDF Day Europe 2017」のスライドやビデオが公開されていました。

https://www.pdfa.org/slides-and-video-recordings-of-the-pdf-days-europe-2017/

PDF2.0 の情報があれば見ておこうと思い Web サイトを訪れたのですが、「Next Generation PDF」という見慣れないワードを見つけました。最初は PDF2.0 のことかと思ったのですが違うようです。初日のキーノートと、3トラックのうち1トラックが「Next Generation PDF」に充てられています。気になり少し調べてみました。

KEYNOTE: Introducing Next-Generation PDF

スライドを見ると、最近のモバイル端末での PDF の閲覧や操作性の問題を課題としているようです。PDF は電子文書フォーマットとして広く普及していますが、モバイル端末環境となると閲覧や操作にかなり不満がありますね。特にスマートフォンでは閲覧するだけでも拡大縮小したり移動したりで大変です。PDF リーダーによっては実装されているリフロー表示もうまく使えないことが多いです。

モバイル端末しか使わないユーザーが急増する中で、Web の世界ではレスポンシブ web デザインやモバイルファースト等、積極的にモバイル環境への対応が進んでいますが、PDF もモバイル端末環境に対応すべく、イベントの主催者である PDF Association のテクニカルワーキンググループで「Next Generation PDF」なるものを検討している、ということのようです。

では「Next Generation PDF」とはどんなものなのか。スライドによると、

  • フル機能の PDF2.0
  • うまくタグ付けされた PDF

と書いてあります。PDF2.0 をベースにした規格になるのでしょうか。

「タグ付きPDF」は、例えば段落、表、ヘッダといった文書の構造情報を PDF に付加するための仕様です。PDF のページは単に文字や線や画像が並べられて見た目が構成されているだけなので、それらが段落、表、ヘッダなど何を表すのかプログラムは正確に判定できず推測するしかありません。そのため、スクリーンリーダーで正しい順序でテキストを読めない、PDF リーダーのテキストリフロー表示がうまくできないといったことが起こります。この問題は「タグ付きPDF」にすることでより正確にできるようになります。
「タグ付きPDF」は PDF1.4 から導入され ISO32000-1(PDF1.7)の仕様の一部ですが、PDF2.0 で見直されることになっています。

キーノートはここまででした。詳しくはあとのセッションでということです。
明日は「Core concepts and use cases」を読んでみたいと思います。

その(2) >>


『PDFインフラストラクチャ解説』出版報告&特別講演会開催のお知らせ

アンテナハウスブログ「I love software」で、2005年10月~2008年7月の1000日間に亘って連載された「PDF 千夜一夜」に、2015年までに集めたPDF関連の情報やオリジナルの内容を加筆修正し、網羅的にまとめあげたものが、『PDFインフラストラクチャ解説:電子の紙PDFとその周辺技術を語り尽す』として出版します。

現段階では、Kindle ダイレクト・パブリッシング(KDP)で出版開始され、もう間もなくペーパーバックでも出版される予定です。

さて、そんなPDFに関する知識が満載された『PDFインフラストラクチャ解説』の出版を記念し、2月16日(火)、講演会を開催します。
PDFにおけるあれやこれを、いろいろ訊けるチャンスです!

『PDFインフラストラクチャ解説』出版記念特別講演会

  • 開催日時: 2016年2月16日(水)16時00分~18時10分
  • 開催場所: 市ヶ谷健保会館 E会議室
  • 参加費講演会のみ: 1,000円(税込)
  • 定員: 30名(事前予約制)
  • 詳細・お申込みURL:http://peatix.com/event/138690

ゲスト
松木眞氏(画像電子学会フェロー):PDFの国際規格ISO32000やPDF/Xなどの派生規格の作成等に参加。
ISO32000:PDFの国際規格の現状と将来について(仮)、いろいろ語っていただきます。

●『PDFインフラストラクチャ解説:電子の紙PDFとその周辺技術を語り尽す』

PDFインフラストラクチャ解説(表紙)

目次・書籍詳細
https://www.antenna.co.jp/pdf/reference/pdf-infra.html
(青い「目次紹介」をクリックすると、目次が表示されます)

本書のご購入は、こちらからどうぞ!
Amazon Kindleストア

エンドユーザーではなく、「技術者向け」の内容です。
(もちろん、技術者でない方でもPDFの成り立ちや、なぜそこにPDFが使われるのかなど、仕事仲間と話題にできる蘊蓄を仕入れられます)
PDFの仕様、製品に実装するための必要な技術情報など、PDFを中心に組版に必須のフォントや文字などの関連項目について解説。PDF登場の経過や歴史的側面の解説も多いので、読みごたえはあるかと思います。
昨今話題の電子署名やタイムスタンプ、長期保存、PDFから別のファイル形式(Officeやimgなど)への逆変換などにも解説しています。

●PR●
PDFに関する疑問にお答えします。「PDF資料室」:https://www.antenna.co.jp/pdf/reference/