カテゴリー別アーカイブ: PDF の仕様

Next Generation PDF について(2)

Core concepts and use cases

キーノートでは詳しいことが分からなかったので、このセッションのスライドを読んでみました。

ここでは「next-generation PDF」を処理する「next-generation processor」という用語が出てきます。その役割は「タグ付きPDFからの導出(Derivation):PDF コンテンツを HTML で表現するための標準化されたモデル」と書かれています。
どうやら、HTML にうまく変換できるような標準化されたタグ付けのモデルとその変換アルゴリズムを定めて、予測可能で互換性のある方法で HTML に変換しよう、ということのようです。

そして、HTML に変換してから端末に応じたスタイルシートを適用することで、既にモバイル環境に対応した Web のテクノロジーを利用して、PDF のコンテンツをモバイル環境で利用できるようにする、という目論見のようです。

PDF から HTML に変換する製品は現時点でも既にあるようで、後のセッションでも紹介があります。標準化された方法でより正確に出来ることを目指そうということでしょうか。

また、ユースケースでは、アクセシビリティの観点からの解説がありました。

U.S. や EU 等の政府機関ではアクセシビリティが要求されますが、既存のスクリーンリーダーなどの Assistive Technology(障害を持つ人々を支援する機器や技術)は HTML をサポートするが、PDF はほとんどサポートされない状況があります。一方で PDF は電子文書としての信頼性と互換性が確立されているので、政府機関は PDF を諦めたくはない。

アクセシビリティの準拠基準は、W3C の WCAG (Web Content Accessibility Guidelines) 規格の達成基準レベル「AA」を条件として示されるようですが、この規格は Web を前提としたもので HTML には適用しやすいが、PDF には直接的に適用しにくいので、PDF が HTML として表現できれば WCAG への適合を判定しやすい、ということが説明されています。

今後 PDF がどのように発展していくのか。「PDF Day Europe 2017」での動向をご紹介しました。参考になれば幸いです。

<< その(1)


Next Generation PDF について(1)

5月15, 16日にドイツのベルリンで開催されたイベント「PDF Day Europe 2017」のスライドやビデオが公開されていました。

https://www.pdfa.org/slides-and-video-recordings-of-the-pdf-days-europe-2017/

PDF2.0 の情報があれば見ておこうと思い Web サイトを訪れたのですが、「Next Generation PDF」という見慣れないワードを見つけました。最初は PDF2.0 のことかと思ったのですが違うようです。初日のキーノートと、3トラックのうち1トラックが「Next Generation PDF」に充てられています。気になり少し調べてみました。

KEYNOTE: Introducing Next-Generation PDF

スライドを見ると、最近のモバイル端末での PDF の閲覧や操作性の問題を課題としているようです。PDF は電子文書フォーマットとして広く普及していますが、モバイル端末環境となると閲覧や操作にかなり不満がありますね。特にスマートフォンでは閲覧するだけでも拡大縮小したり移動したりで大変です。PDF リーダーによっては実装されているリフロー表示もうまく使えないことが多いです。

モバイル端末しか使わないユーザーが急増する中で、Web の世界ではレスポンシブ web デザインやモバイルファースト等、積極的にモバイル環境への対応が進んでいますが、PDF もモバイル端末環境に対応すべく、イベントの主催者である PDF Association のテクニカルワーキンググループで「Next Generation PDF」なるものを検討している、ということのようです。

では「Next Generation PDF」とはどんなものなのか。スライドによると、

  • フル機能の PDF2.0
  • うまくタグ付けされた PDF

と書いてあります。PDF2.0 をベースにした規格になるのでしょうか。

「タグ付きPDF」は、例えば段落、表、ヘッダといった文書の構造情報を PDF に付加するための仕様です。PDF のページは単に文字や線や画像が並べられて見た目が構成されているだけなので、それらが段落、表、ヘッダなど何を表すのかプログラムは正確に判定できず推測するしかありません。そのため、スクリーンリーダーで正しい順序でテキストを読めない、PDF リーダーのテキストリフロー表示がうまくできないといったことが起こります。この問題は「タグ付きPDF」にすることでより正確にできるようになります。
「タグ付きPDF」は PDF1.4 から導入され ISO32000-1(PDF1.7)の仕様の一部ですが、PDF2.0 で見直されることになっています。

キーノートはここまででした。詳しくはあとのセッションでということです。
明日は「Core concepts and use cases」を読んでみたいと思います。

その(2) >>


Acrobat の不満点(その2)

前回 に引き続き、Acrobat の不満点を書いてみます。

Acrobat にて PDF を作成し、印刷も視野に入れていたため CMYK の ICC Profile を出力インテントに指定して PDF/A-2 形式で保存しました。

PDF/A-2 ではベースバージョンが PDF1.7 となったため、PDF1.4 というベースバージョンの制約があった PDF/A-1 と比べて非常に有効なバージョンになります。
以下は PDF/A-2 によって実現可能となった機能の一部です。

  • PDF 1.4 -> PDF 1.5
    JPEG2000圧縮によるイメージ
    オブジェクトストリーム、Xrefストリーム(圧縮率の向上)
    オプショナルコンテント
    XFA Form
  • PDF 1.5 -> PDF 1.6
    暗号化機能の強化(AES暗号化の追加)
    カラースペース追加(DeviceN、NChannel)
  • PDF 1.6 -> PDF 1.7(ISO 32000-1)
    3Dアートワーク
    ポータブルコレクション

PDF/A-2 の詳細につきましては、PDF資料室 過去のブログ にまとめておりますので、参照ください。

さて、PDF/A-2 で保存した結果、出力された出力インテントが RGB の ICC Profile に置き換わってしまいました。
作成した PDF にはテキスト注釈、スタンプ注釈といった注釈が含まれていたのですが、この事が原因で強制的に RGB となってしまったのでしょうか。
PDF/A-2 の仕様では CMYK が使用できない、といった制限はありませんので、不思議な結果となりました。
CMYK の ICC Profile を出力する方法はあるのでしょうか。

<< その(1)


Acrobat の不満点(その1)

日頃 PDF ファイルの編集作業で Adobe Acrobat を使用する機会が多いのですが、使用している中で不満に感じている事を書いてみます。

PDF では対話フォーム(AcroForm)と呼ばれる、使用者から対話的に情報を収集するフィールドを持つことができます。
その中にはテキストフィールド、ラジオボタン、リストボックスといった使用者が入力するフィールドや、ボタンのようにアクションを関連付けて特定のページへジャンプするようなアクションを指定することができる便利な機能です。Acrobat では「ツール」の「フォーム」にて作成可能です。

この機能は PDF1.2 以降で使用可能な機能なので、使用している方も多いのではないでしょうか。

さて、この対話フォーム(AcroForm)を使用した PDF を作成し、PDF/A(*1) へ別名保存してみます。 ところが PDF/A として保存した PDF で、表示上はボタンの画像やテキストボックス風のエリア、ラジオボタン風の円が残るのですが、マウスクリックしても全く機能しません。
Acrobat では PDF/A 保存すると、外観だけを残して対話フォーム(AcroForm)の機能自体を削除してしまうようです。

確かに長期保存する文書で使用者との対話は不向きなのかもしれませんが、ボタンでのページ移動等のように便利な機能もあるので削除してしまうのは惜しいと感じています。

(*1)
PDF/A(ISO 19005の同義語)は、国際標準化機構 ISO が制定した国際規格 ISO 19005 に定められる PDF の形式の1つです。このファイル形式の第一の目的は、使用するツールにかかわらず、長期間に渡ってファイルの視覚的な外観を維持できること、第二の目的は、PDF の視覚的な外観ではなく、論理構造、意味といった情報を格納できるようにすることにあります。
PDF/A につきましては、PDF資料室過去のブログ にまとめておりますので、参照ください。

その(2) >>


ISO 32000-2 PDF 2.0策定の進捗、新しく追加になった主要機能のリスト

PDF 2.0の仕様策定がだいぶ進んでいます。現在のステータスは、40.99(Full report circulated: DIS approved for registration as FDIS)とありますのでもうすぐ最終承認プロセスになりそうです。Adobeの担当者のコメントでは、夏前に出版される可能性はない[1]とありますが。いずれにせよそう遠い時期ではないでしょう。

ドラフトの仕様書はISOのストアで販売されています[2]

このドラフト仕様書によりPDF 2.0の主な変更点をチェックしてみました。次に項目だけ挙げます。技術書典2[3]にむけて『PDFインフラストラクチャ解説』[4]の第二版を準備中ですので、もう少し調べて第二版に反映します。

本文でPDF 2.0で廃止という意味は、PDF のバージョン番号に2.0を指定したときは使ってはいけないという意味です。PDF 1.7以前のバージョン番号を指定したときPDFで使うのは問題ありません。

1.文書のメタデータ(7.5.5 File trailer、14.3.3 Document information dictionary)
メタデータは文書情報ではなくXMPによるメタデータストリームを使うことになります。文書情報の中でPDF 2.0で許されるのは作成日と更新日のみです。それ以外の項目は廃止となります。

2.暗号化(7.6 Encryption、7.6.3 General encryption algorithm)
PDF 2.0では暗号化のアルゴリズムはAES-256対称キーアルゴリズムの32バイトファイル暗号化キーを使うようになります。RC4とかAESアルゴリズムは廃止です。

3.標準セキュリティハンドラー(7.6.4.2 Standard encryption dictionary)
新しいバージョン番号を指定します。古いセキュリティハンドラは廃止です。

4.(新機能)非暗号化ラッパ文書(7.6.6 Unencrypted wrapper document)
独自のセキュリティハンドラで暗号化してしまうとその内容にアクセスできなくなります。これを避けるため暗号化しないラッパを残すことができます。

5.テキスト文字列(7.9.2.2 Text string type)
UnicodeのUTF-8の符号化をつかえるようになります。

6.黒点補償(8.6.5.9 Use of black point compensation)
デバイス独立グラフィック状態に黒点補償パラメータが追加になります。

7.文書レベルのナビゲーション(12.3 Document-level navigation)
コレクション(PDF 1.7のアドビ独自拡張)の機能が大幅強化となります。(12.3.5 Collections)
・コレクションに階層化フォルダーが設定できます。(12.3.5.2 Collection hierarchical folders)
・navigatorにレディメイドのコレクションのレイアウトを指定できます。(12.3.6 Navigators)

8. 注釈タイプ(12.5.6.1 General)
プロジェクション注釈が新しく用意されます。(12.5.6.24 Projection annotations)
リッチメディア注釈が新しく用意されます。(12.5.6.25 3D and RichMedia annotations)
音声(Sound)注釈、動画(Movie)注釈、TrapNet注釈の3種類は廃止となります。

9.フォーム(12.7 Forms、12.7.3 Interactive form dictionary)
XFAフォームは廃止となります。
フォームの外観は常に必要となります。

10.電子署名(12.8 Digital signatures)
大幅に変更になります。
PAdESが追加されます。(12.8.3.4 CAdES signatures as used in PDF)
署名の長期検証機能が追加になります。(12.8.4 Long term validation of signatures)
文書タイムスタンプが追加になります。(12.8.5 Documenttimestamp (DTS) dictionary)

11. 地理空間座標システム(12.10 Geospatial features)
新機能です。
地球上の地図と連動する位置指定ができるようです。

12. 3次元アートワーク(13.6 3D Artwork)
大幅強化されます。
3次元の注釈機能が強化されます。(13.6.2 3D Annotations)
3次元の距離(直線距離、垂直距離、角距離)が定義できるようになります。(13.6.7 Persistence of 3D measurements and markups)

13. リッチメディア(13.7 Rich media)
リッチメディアが強化されます。
音声・動画が廃止となりリッチメディアに統合されます。

14. 論理構造(14.7 Logical structure)
タグ付きPDFのタグに、名前空間を使えるようになります。(14.7.4 Namespaces for tagged PDF)
タグ付きPDFのタグの構造が大幅に変更になります。

15. アクセシビリティ
発音のヒント機能が追加になります。(14.9.6 Pronunciation hints)

16. 文書部品(14.12 Document parts)
新機能です。PDFのページへのランダムアクセス機能が強化されます。

17. 関連ファイル(14.13 Associated files)
新機能です。

[1] https://forums.adobe.com/message/9134153#9134153
[2] ISO/DIS 32000-2.4 Document management — Portable document format — Part 2: PDF 2.0
[3] 技術書典2
[4] 『PDFインフラストラクチャ解説』

2017/3/3追記

『PDFインフラストラクチャ解説』V1.1の原稿を下記に公開しました。

付録:もうすぐ出版されるPDF 2.0の概要

『PDFインフラストラクチャ解説』を1.1版に改訂し、上のWebページをそのままV1.1版の付録として収録します。付録にしたのは仕様書がまだドラフトのためです。すでに本をお求めの方は、Webをご覧いただければ改めてご購入の必要はありません。

新しくお求めのかたはしばらくお待ちください。今週月曜日にPODに出しましたので、来週には発売されると思います。


『瞬簡PDF 書けまっせ 7』最新版を紹介するセミナー

PDFに文字や図形を簡単に追加できる『瞬簡PDF 書けまっせ7』最新版に触れるチャンス

10月24日月曜日に東京曙橋の市ヶ谷健保会館「CAS-UB サービス開始五周年記念セミナー」アンテナハウス主催で開催いたします。

このセミナーは2部構成になっており、前半の第1部で、弊社一番人気の新バージョン『瞬簡PDF 書けまっせ7』をご紹介します。

PDFに文字や図形を追加できると、PDFの利便性が飛躍的に高まります。『瞬簡PDF 書けまっせ7』は、簡単な操作でPDFに文字や図形を追加することができます。今回は初めて『瞬簡PDF 書けまっせ7』をご覧になる方を対象に、簡単なデモを交えながら、『瞬簡PDF 書けまっせ7』のポイントをご覧いただきます。

アンテナハウスが取り組むPDFの課題

2016年4月より障害者差別解消法が施行され、PDFで提供する情報内容をアクセシブルとすることが求められています。『瞬簡PDF 書けまっせ7』ご紹介の後、短い時間ではありますが、PDFのアクセシビリティとはどのようなことか、どういった方法でアクセシブルPDFにできるかを整理しつつ、アンテナハウスでの取り組みを簡単に説明します。

10月24日(月)のセミナーへのお申し込みはこちらからどうぞ:
http://www.cas-ub.com/user/seminar.html

 


『PDFインフラストラクチャ解説』出版報告&特別講演会開催のお知らせ

アンテナハウスブログ「I love software」で、2005年10月~2008年7月の1000日間に亘って連載された「PDF 千夜一夜」に、2015年までに集めたPDF関連の情報やオリジナルの内容を加筆修正し、網羅的にまとめあげたものが、『PDFインフラストラクチャ解説:電子の紙PDFとその周辺技術を語り尽す』として出版します。

現段階では、Kindle ダイレクト・パブリッシング(KDP)で出版開始され、もう間もなくペーパーバックでも出版される予定です。

さて、そんなPDFに関する知識が満載された『PDFインフラストラクチャ解説』の出版を記念し、2月16日(火)、講演会を開催します。
PDFにおけるあれやこれを、いろいろ訊けるチャンスです!

『PDFインフラストラクチャ解説』出版記念特別講演会

  • 開催日時: 2016年2月16日(水)16時00分~18時10分
  • 開催場所: 市ヶ谷健保会館 E会議室
  • 参加費講演会のみ: 1,000円(税込)
  • 定員: 30名(事前予約制)
  • 詳細・お申込みURL:http://peatix.com/event/138690

ゲスト
松木眞氏(画像電子学会フェロー):PDFの国際規格ISO32000やPDF/Xなどの派生規格の作成等に参加。
ISO32000:PDFの国際規格の現状と将来について(仮)、いろいろ語っていただきます。

●『PDFインフラストラクチャ解説:電子の紙PDFとその周辺技術を語り尽す』

PDFインフラストラクチャ解説(表紙)

目次・書籍詳細
http://www.antenna.co.jp/pdf/reference/pdf-infra.html
(青い「目次紹介」をクリックすると、目次が表示されます)

本書のご購入は、こちらからどうぞ!
Amazon Kindleストア

エンドユーザーではなく、「技術者向け」の内容です。
(もちろん、技術者でない方でもPDFの成り立ちや、なぜそこにPDFが使われるのかなど、仕事仲間と話題にできる蘊蓄を仕入れられます)
PDFの仕様、製品に実装するための必要な技術情報など、PDFを中心に組版に必須のフォントや文字などの関連項目について解説。PDF登場の経過や歴史的側面の解説も多いので、読みごたえはあるかと思います。
昨今話題の電子署名やタイムスタンプ、長期保存、PDFから別のファイル形式(Officeやimgなど)への逆変換などにも解説しています。

●PR●
PDFに関する疑問にお答えします。「PDF資料室」:http://www.antenna.co.jp/pdf/reference/


PDFとEPUBのフォント埋め込みについての簡単な解説文

CAS-UBのブログで、PDFとEPUBのフォント埋め込みについての簡単な用語解説文を書いています。

フォント埋め込みとは

電子ドキュメント内の文字情報は文字コードを使って表されるが、文字コードだけでは文字の形は分からない。文字コードをもとに文字の形を描画するにはフォントを使う。電子ドキュメント作成時にフォントのデータを内部に含めることを「フォント埋め込み」という。フォントを埋め込んだ電子ドキュメントを配布すれば、受け手は埋め込まれたフォントを使って文字を可視化できるので、例えば太字、丸文字など、ドキュメント作成者の意図した形で文字を表現できる。

さらに詳しく


[MS14-045] 更新プログラム 2982791 の問題を解決する更新プログラム 2993651 を公開

こんにちは、弊社デスクトップ製品のサポート担当です。

前回は、8月13日以降に配信されたWindows Update の更新プログラムでブルーバックが起きる問題について取り上げました。

この更新プログラムは8月13日から15日にかけて配信がされ、8月18日以降は配信が停止されたため、この期間内にWindows Updateを行ったパソコンにのみインストールがされて問題を起こすというものでした。
このため、いったんこの更新プログラムをパソコンからアンインストールすれば、その後は問題が起きないようになっていました。

ところが、9月になってお客様から、いったんブルーバックが出ないようになったはずなのにまた同じ問題が再発するようになったとのお問い合わせをいただくようになりました。
調べてみると、Microsoft社から8月27日以降に新たな更新プログラムが配信されていました。

それによりますと、この更新プログラムは8月13日に公開して問題となったKB2982791の不具合を修正するものであるとの説明がされ、インストールを行うように推奨されています。
しかしながら、弊社で確認をしたところ、この更新プログラムがインストールされていることでブルーバックの問題が再発しており、これをアンインストールすることで問題が回避できる場合があることが分かりました。

問題の解決のためには、この更新プログラムのアンインストールをお勧めしたいところですが、現在、Microsoft社から”KB2993651″は重要なセキュリティの更新プログラムであるという案内がされています。
このため、もしお客様でこの更新プログラムを削除されたくない場合は、当面の回避策として内容をPDFに保存し、PDFを表示したアプリケーションから印刷を行っていただくことをお願いしております。
ただ、これはあくまで印刷を行う場合のみの回避策であり、他のケースには使えません。
そのような場合には、いったんこの更新プログラムを削除して様子をみていただくようご案内しております。

この更新プログラムの別の情報「[MS14-045] カーネル モード ドライバーのセキュリティ更新プログラムについて (2014 年 8 月 27 日)」によれば、この更新プログラムには既知の問題が残っており、「マイクロソフトでは現在この問題の解決に取り組んでいます。」との説明があります。明確ではありませんが、今後別の更新プログラムが用意されて改善される可能性も考えられます。
弊社でも、新しい情報があれば適宜ご案内していきたいと思いますので、よろしくお願いいたします。

この問題の詳細につきましては弊社ホームページおよび製品サイトでもご案内しておりますので、ご参照ください。


2014 年 8 月 13 日公開の更新プログラムの適用により問題が発生する場合がある

こんにちは、弊社デスクトップ製品のサポート担当です。平素は弊社製品をご愛用いただき、ありがとうございます。

さて、お盆休みがあけた8月17日の週から弊社サポートにはたくさんのお問い合わせが寄せられております。

お問い合わせの内容は、弊社製品『瞬簡PDF 書けまっせ6』、『書けまっせ!PDF5』、『瞬簡PDF 編集5』に関するもので、それぞれ操作画面から印刷を行うとWindowsがシャットダウンして青い画面に白字でエラーが表示され再起動されてしまうというものです。
Windowsでシャットダウン時に青い画面が表示されるのは、ブルーバックまたはブルースクリーンと呼ばれるもので、OSの中核部分に問題が生じた場合に発生するかなり深刻な状態です。

それまで弊社製品から普通に印刷ができていたものが、ある日を境に急にこのような現象が起きてしまったということで驚かれたお客様が多かったかと思います。また、時間をかけて編集した内容が一瞬にしてなくなってしまわれた方もおられました。

問題の起きた状況から、Windowsの更新プログラムが関連している可能性が推測されましたが、
これについて、Microsoft社から、8月13日に配信されたWindows Update の更新プログラムに問題があったことが同社のブログ記事で公開されました。

それによりますと、全部で4つの更新プログラムのいずれかが関与していること、これらをパソコンからアンインストールすることで問題が回避できること、これらの更新プログラムの配信は8月18日より停止したことが説明されています。

弊社で確認をしたところ、以下の二つの更新プログラムをアンインストールすることで問題が回避できることが分かりましたので、お客様にもそのようにご案内を行っております。

  • KB2982791
  • KB2970228

この問題の詳細につきましては弊社ホームページおよび製品サイトでもご案内しておりますので、ご参照ください。

※なお、『瞬簡PDF 書けまっせ6』では、PDFを表示した画面に別のPDFファイルを画像として挿入する操作でもブルーバックが発生することが確認されております。この場合も上記と同様の対処方法で回避できることを確認しております。
※この問題につきましては続報を次回掲載いたします。


Pages: 1 2 Next