カテゴリー別アーカイブ: PDF の仕様

Acrobat の不満点(その1)

日頃 PDF ファイルの編集作業で Adobe Acrobat を使用する機会が多いのですが、使用している中で不満に感じている事を書いてみます。

PDF では対話フォーム(AcroForm)と呼ばれる、使用者から対話的に情報を収集するフィールドを持つことができます。
その中にはテキストフィールド、ラジオボタン、リストボックスといった使用者が入力するフィールドや、ボタンのようにアクションを関連付けて特定のページへジャンプするようなアクションを指定することができる便利な機能です。Acrobat では「ツール」の「フォーム」にて作成可能です。

この機能は PDF1.2 以降で使用可能な機能なので、使用している方も多いのではないでしょうか。

さて、この対話フォーム(AcroForm)を使用した PDF を作成し、PDF/A(*1) へ別名保存してみます。 ところが PDF/A として保存した PDF で、表示上はボタンの画像やテキストボックス風のエリア、ラジオボタン風の円が残るのですが、マウスクリックしても全く機能しません。
Acrobat では PDF/A 保存すると、外観だけを残して対話フォーム(AcroForm)の機能自体を削除してしまうようです。

確かに長期保存する文書で使用者との対話は不向きなのかもしれませんが、ボタンでのページ移動等のように便利な機能もあるので削除してしまうのは惜しいと感じています。

(*1)
PDF/A(ISO 19005の同義語)は、国際標準化機構 ISO が制定した国際規格 ISO 19005 に定められる PDF の形式の1つです。このファイル形式の第一の目的は、使用するツールにかかわらず、長期間に渡ってファイルの視覚的な外観を維持できること、第二の目的は、PDF の視覚的な外観ではなく、論理構造、意味といった情報を格納できるようにすることにあります。
PDF/A につきましては、PDF資料室過去のブログ にまとめておりますので、参照ください。

その(2) >>




瞬簡PDF 編集 2024
かんたん操作でPDFを自由自在に編集


瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識

ISO 32000-2 PDF 2.0策定の進捗、新しく追加になった主要機能のリスト

PDF 2.0の仕様策定がだいぶ進んでいます。現在のステータスは、40.99(Full report circulated: DIS approved for registration as FDIS)とありますのでもうすぐ最終承認プロセスになりそうです。Adobeの担当者のコメントでは、夏前に出版される可能性はない[1]とありますが。いずれにせよそう遠い時期ではないでしょう。

ドラフトの仕様書はISOのストアで販売されています[2]

このドラフト仕様書によりPDF 2.0の主な変更点をチェックしてみました。次に項目だけ挙げます。技術書典2[3]にむけて『PDFインフラストラクチャ解説』[4]の第二版を準備中ですので、もう少し調べて第二版に反映します。

本文でPDF 2.0で廃止という意味は、PDF のバージョン番号に2.0を指定したときは使ってはいけないという意味です。PDF 1.7以前のバージョン番号を指定したときPDFで使うのは問題ありません。

1.文書のメタデータ(7.5.5 File trailer、14.3.3 Document information dictionary)
メタデータは文書情報ではなくXMPによるメタデータストリームを使うことになります。文書情報の中でPDF 2.0で許されるのは作成日と更新日のみです。それ以外の項目は廃止となります。

2.暗号化(7.6 Encryption、7.6.3 General encryption algorithm)
PDF 2.0では暗号化のアルゴリズムはAES-256対称キーアルゴリズムの32バイトファイル暗号化キーを使うようになります。RC4とかAESアルゴリズムは廃止です。

3.標準セキュリティハンドラー(7.6.4.2 Standard encryption dictionary)
新しいバージョン番号を指定します。古いセキュリティハンドラは廃止です。

4.(新機能)非暗号化ラッパ文書(7.6.6 Unencrypted wrapper document)
独自のセキュリティハンドラで暗号化してしまうとその内容にアクセスできなくなります。これを避けるため暗号化しないラッパを残すことができます。

5.テキスト文字列(7.9.2.2 Text string type)
UnicodeのUTF-8の符号化をつかえるようになります。

6.黒点補償(8.6.5.9 Use of black point compensation)
デバイス独立グラフィック状態に黒点補償パラメータが追加になります。

7.文書レベルのナビゲーション(12.3 Document-level navigation)
コレクション(PDF 1.7のアドビ独自拡張)の機能が大幅強化となります。(12.3.5 Collections)
・コレクションに階層化フォルダーが設定できます。(12.3.5.2 Collection hierarchical folders)
・navigatorにレディメイドのコレクションのレイアウトを指定できます。(12.3.6 Navigators)

8. 注釈タイプ(12.5.6.1 General)
プロジェクション注釈が新しく用意されます。(12.5.6.24 Projection annotations)
リッチメディア注釈が新しく用意されます。(12.5.6.25 3D and RichMedia annotations)
音声(Sound)注釈、動画(Movie)注釈、TrapNet注釈の3種類は廃止となります。

9.フォーム(12.7 Forms、12.7.3 Interactive form dictionary)
XFAフォームは廃止となります。
フォームの外観は常に必要となります。

10.電子署名(12.8 Digital signatures)
大幅に変更になります。
PAdESが追加されます。(12.8.3.4 CAdES signatures as used in PDF)
署名の長期検証機能が追加になります。(12.8.4 Long term validation of signatures)
文書タイムスタンプが追加になります。(12.8.5 Documenttimestamp (DTS) dictionary)

11. 地理空間座標システム(12.10 Geospatial features)
新機能です。
地球上の地図と連動する位置指定ができるようです。

12. 3次元アートワーク(13.6 3D Artwork)
大幅強化されます。
3次元の注釈機能が強化されます。(13.6.2 3D Annotations)
3次元の距離(直線距離、垂直距離、角距離)が定義できるようになります。(13.6.7 Persistence of 3D measurements and markups)

13. リッチメディア(13.7 Rich media)
リッチメディアが強化されます。
音声・動画が廃止となりリッチメディアに統合されます。

14. 論理構造(14.7 Logical structure)
タグ付きPDFのタグに、名前空間を使えるようになります。(14.7.4 Namespaces for tagged PDF)
タグ付きPDFのタグの構造が大幅に変更になります。

15. アクセシビリティ
発音のヒント機能が追加になります。(14.9.6 Pronunciation hints)

16. 文書部品(14.12 Document parts)
新機能です。PDFのページへのランダムアクセス機能が強化されます。

17. 関連ファイル(14.13 Associated files)
新機能です。

[1] https://forums.adobe.com/message/9134153#9134153
[2] ISO/DIS 32000-2.4 Document management — Portable document format — Part 2: PDF 2.0
[3] 技術書典2
[4] 『PDFインフラストラクチャ解説』

2017/3/3追記

『PDFインフラストラクチャ解説』V1.1の原稿を下記に公開しました。

付録:もうすぐ出版されるPDF 2.0の概要

『PDFインフラストラクチャ解説』を1.1版に改訂し、上のWebページをそのままV1.1版の付録として収録します。付録にしたのは仕様書がまだドラフトのためです。すでに本をお求めの方は、Webをご覧いただければ改めてご購入の必要はありません。

新しくお求めのかたはしばらくお待ちください。今週月曜日にPODに出しましたので、来週には発売されると思います。




瞬簡PDF 作成 2024
ドラッグ&ドロップでPDF作成


HTML on Word
WebページをWordで作る!

『瞬簡PDF 書けまっせ 7』最新版を紹介するセミナー

PDFに文字や図形を簡単に追加できる『瞬簡PDF 書けまっせ7』最新版に触れるチャンス

10月24日月曜日に東京曙橋の市ヶ谷健保会館「CAS-UB サービス開始五周年記念セミナー」アンテナハウス主催で開催いたします。

このセミナーは2部構成になっており、前半の第1部で、弊社一番人気の新バージョン『瞬簡PDF 書けまっせ7』をご紹介します。

PDFに文字や図形を追加できると、PDFの利便性が飛躍的に高まります。『瞬簡PDF 書けまっせ7』は、簡単な操作でPDFに文字や図形を追加することができます。今回は初めて『瞬簡PDF 書けまっせ7』をご覧になる方を対象に、簡単なデモを交えながら、『瞬簡PDF 書けまっせ7』のポイントをご覧いただきます。

アンテナハウスが取り組むPDFの課題

2016年4月より障害者差別解消法が施行され、PDFで提供する情報内容をアクセシブルとすることが求められています。『瞬簡PDF 書けまっせ7』ご紹介の後、短い時間ではありますが、PDFのアクセシビリティとはどのようなことか、どういった方法でアクセシブルPDFにできるかを整理しつつ、アンテナハウスでの取り組みを簡単に説明します。

10月24日(月)のセミナーへのお申し込みはこちらからどうぞ:
http://www.cas-ub.com/user/seminar.html

 




HTML on Word
WebページをWordで作る!


瞬簡PDF 作成 2024
ドラッグ&ドロップでPDF作成

『PDFインフラストラクチャ解説』出版報告&特別講演会開催のお知らせ

アンテナハウスブログ「I love software」で、2005年10月~2008年7月の1000日間に亘って連載された「PDF 千夜一夜」に、2015年までに集めたPDF関連の情報やオリジナルの内容を加筆修正し、網羅的にまとめあげたものが、『PDFインフラストラクチャ解説:電子の紙PDFとその周辺技術を語り尽す』として出版します。

現段階では、Kindle ダイレクト・パブリッシング(KDP)で出版開始され、もう間もなくペーパーバックでも出版される予定です。

さて、そんなPDFに関する知識が満載された『PDFインフラストラクチャ解説』の出版を記念し、2月16日(火)、講演会を開催します。
PDFにおけるあれやこれを、いろいろ訊けるチャンスです!

『PDFインフラストラクチャ解説』出版記念特別講演会

  • 開催日時: 2016年2月16日(水)16時00分~18時10分
  • 開催場所: 市ヶ谷健保会館 E会議室
  • 参加費講演会のみ: 1,000円(税込)
  • 定員: 30名(事前予約制)
  • 詳細・お申込みURL:http://peatix.com/event/138690

ゲスト
松木眞氏(画像電子学会フェロー):PDFの国際規格ISO32000やPDF/Xなどの派生規格の作成等に参加。
ISO32000:PDFの国際規格の現状と将来について(仮)、いろいろ語っていただきます。

●『PDFインフラストラクチャ解説:電子の紙PDFとその周辺技術を語り尽す』

PDFインフラストラクチャ解説(表紙)

目次・書籍詳細
https://www.antenna.co.jp/pdf/reference/pdf-infra.html
(青い「目次紹介」をクリックすると、目次が表示されます)

本書のご購入は、こちらからどうぞ!
Amazon Kindleストア

エンドユーザーではなく、「技術者向け」の内容です。
(もちろん、技術者でない方でもPDFの成り立ちや、なぜそこにPDFが使われるのかなど、仕事仲間と話題にできる蘊蓄を仕入れられます)
PDFの仕様、製品に実装するための必要な技術情報など、PDFを中心に組版に必須のフォントや文字などの関連項目について解説。PDF登場の経過や歴史的側面の解説も多いので、読みごたえはあるかと思います。
昨今話題の電子署名やタイムスタンプ、長期保存、PDFから別のファイル形式(Officeやimgなど)への逆変換などにも解説しています。

●PR●
PDFに関する疑問にお答えします。「PDF資料室」:https://www.antenna.co.jp/pdf/reference/




瞬簡PDF 編集 2024
かんたん操作でPDFを自由自在に編集


アウトライナー
PDFを解析して しおり・目次を自動生成

PDFとEPUBのフォント埋め込みについての簡単な解説文

CAS-UBのブログで、PDFとEPUBのフォント埋め込みについての簡単な用語解説文を書いています。

フォント埋め込みとは

電子ドキュメント内の文字情報は文字コードを使って表されるが、文字コードだけでは文字の形は分からない。文字コードをもとに文字の形を描画するにはフォントを使う。電子ドキュメント作成時にフォントのデータを内部に含めることを「フォント埋め込み」という。フォントを埋め込んだ電子ドキュメントを配布すれば、受け手は埋め込まれたフォントを使って文字を可視化できるので、例えば太字、丸文字など、ドキュメント作成者の意図した形で文字を表現できる。

さらに詳しく




瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識


瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品!

[MS14-045] 更新プログラム 2982791 の問題を解決する更新プログラム 2993651 を公開

こんにちは、弊社デスクトップ製品のサポート担当です。

前回は、8月13日以降に配信されたWindows Update の更新プログラムでブルーバックが起きる問題について取り上げました。

この更新プログラムは8月13日から15日にかけて配信がされ、8月18日以降は配信が停止されたため、この期間内にWindows Updateを行ったパソコンにのみインストールがされて問題を起こすというものでした。
このため、いったんこの更新プログラムをパソコンからアンインストールすれば、その後は問題が起きないようになっていました。

ところが、9月になってお客様から、いったんブルーバックが出ないようになったはずなのにまた同じ問題が再発するようになったとのお問い合わせをいただくようになりました。
調べてみると、Microsoft社から8月27日以降に新たな更新プログラムが配信されていました。

それによりますと、この更新プログラムは8月13日に公開して問題となったKB2982791の不具合を修正するものであるとの説明がされ、インストールを行うように推奨されています。
しかしながら、弊社で確認をしたところ、この更新プログラムがインストールされていることでブルーバックの問題が再発しており、これをアンインストールすることで問題が回避できる場合があることが分かりました。

問題の解決のためには、この更新プログラムのアンインストールをお勧めしたいところですが、現在、Microsoft社から”KB2993651″は重要なセキュリティの更新プログラムであるという案内がされています。
このため、もしお客様でこの更新プログラムを削除されたくない場合は、当面の回避策として内容をPDFに保存し、PDFを表示したアプリケーションから印刷を行っていただくことをお願いしております。
ただ、これはあくまで印刷を行う場合のみの回避策であり、他のケースには使えません。
そのような場合には、いったんこの更新プログラムを削除して様子をみていただくようご案内しております。

この更新プログラムの別の情報「[MS14-045] カーネル モード ドライバーのセキュリティ更新プログラムについて (2014 年 8 月 27 日)」によれば、この更新プログラムには既知の問題が残っており、「マイクロソフトでは現在この問題の解決に取り組んでいます。」との説明があります。明確ではありませんが、今後別の更新プログラムが用意されて改善される可能性も考えられます。
弊社でも、新しい情報があれば適宜ご案内していきたいと思いますので、よろしくお願いいたします。

この問題の詳細につきましては弊社ホームページおよび製品サイトでもご案内しておりますので、ご参照ください。




瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品!


アウトライナー
PDFを解析して しおり・目次を自動生成

2014 年 8 月 13 日公開の更新プログラムの適用により問題が発生する場合がある

こんにちは、弊社デスクトップ製品のサポート担当です。平素は弊社製品をご愛用いただき、ありがとうございます。

さて、お盆休みがあけた8月17日の週から弊社サポートにはたくさんのお問い合わせが寄せられております。

お問い合わせの内容は、弊社製品『瞬簡PDF 書けまっせ6』、『書けまっせ!PDF5』、『瞬簡PDF 編集5』に関するもので、それぞれ操作画面から印刷を行うとWindowsがシャットダウンして青い画面に白字でエラーが表示され再起動されてしまうというものです。
Windowsでシャットダウン時に青い画面が表示されるのは、ブルーバックまたはブルースクリーンと呼ばれるもので、OSの中核部分に問題が生じた場合に発生するかなり深刻な状態です。

それまで弊社製品から普通に印刷ができていたものが、ある日を境に急にこのような現象が起きてしまったということで驚かれたお客様が多かったかと思います。また、時間をかけて編集した内容が一瞬にしてなくなってしまわれた方もおられました。

問題の起きた状況から、Windowsの更新プログラムが関連している可能性が推測されましたが、
これについて、Microsoft社から、8月13日に配信されたWindows Update の更新プログラムに問題があったことが同社のブログ記事で公開されました。

それによりますと、全部で4つの更新プログラムのいずれかが関与していること、これらをパソコンからアンインストールすることで問題が回避できること、これらの更新プログラムの配信は8月18日より停止したことが説明されています。

弊社で確認をしたところ、以下の二つの更新プログラムをアンインストールすることで問題が回避できることが分かりましたので、お客様にもそのようにご案内を行っております。

  • KB2982791
  • KB2970228

この問題の詳細につきましては弊社ホームページおよび製品サイトでもご案内しておりますので、ご参照ください。

※なお、『瞬簡PDF 書けまっせ6』では、PDFを表示した画面に別のPDFファイルを画像として挿入する操作でもブルーバックが発生することが確認されております。この場合も上記と同様の対処方法で回避できることを確認しております。
※この問題につきましては続報を次回掲載いたします。




瞬簡PDF 作成 2024
ドラッグ&ドロップでPDF作成


瞬簡PDF 変換 2024
PDFをOffice文書へ高精度変換

PDFの色指定について(2)

前回、PDFのデバイスカラースペースの3種類について説明しました。これらはその名前にある通りデバイスに依存したカラーの表現方法でした。そのため同じRGB値、あるいはCMYK値でも、デバイスが異なると違って見えることになります。同じ写真を2つの違うプリンタで印刷したり、同じ番組を違うテレビで見たり、といった身近なところでも経験することが多いかと思います。PDFの場合にあてはめれば、何か文書を作成してPDF化し、他の人にそのPDFを送って参照してもらうような場合に、作成した人が見ている画面と、送った先の人が見ている画面(あるいは印刷した紙)では別の色が表示されている、という現象になります。

このあたりを解決する、つまり異なるデバイス間で、同じカラー指定に対して同じ出力を行うことを目的としたカラースペースがCIEベースのカラースペースとなります。同じ出力といっても、当然ながら「そのデバイスの制限範囲内で」という制限がつきます。ディスプレイにしてもプリンタにしても、デバイスによって可能な色の再現範囲は異なりますので、その中で、指定に近い出力を得る(カラー値やカラースペースをどう調整しても、モノクロプリンタでカラー写真を印刷はできませんし)ことが目標となります。

前回記載したPDFで定義されている CIEベースカラースペース として、CalGray、CalRGB、Labおよび ICCBased の4種類を記載しました。これらのカラースペースの内容、指定されたカラー値を再現する方法の説明となるわけですが、PDFの仕様以前に、色とは何か、という非常にやっかいな説明が必要となってしまいます。わかる範囲で少し説明を試みてみたいと思います(デバイスカラースペースは、光の3原色、あるいは、プリンタのインクというような身近なところから、なんとなく理解できそうなので、色とは、などという説明抜きでなんとなく説明できましたが)。

おおざっぱにいえば、なんらかの光源から発した光が、物体にあたって反射し、人間の目に入り、人間がその物体の色として認識する、ということになります。赤いクルマといっても、太陽光の下で見る場合と、トンネル中の証明で見る場合と違うのは光源の発する光の性質が異なっていることによります。この光ですが、波としての性質を持つ、空中を伝わる振動エネルギーの束と考えることができるようです。波の性質として波長がありますが、高エネルギーの光の波長は短く(たとえば、X線では 1nm)、低エネルギーの光の波長は長く(ラジオの中波は100m~1km)なります。人間の目がとらえることができる可視光の波長は380nm~700nmのきわめて狭い領域ですが、この短波長側の光を紫、長波長側の光を赤として認識します。その外側がそれぞれ紫外線、赤外線と呼んだりします。また、虹などでは紫から赤までを適当に区切って7色と数えたりします。太陽光のような実際の光はいろいろな波長が混在した光です。可視光内で、緑の波長(国際照明委員会の規定では546.1nmだそうです)が多く含まれていれば緑、各波長の光が均等に含まれていると白と認識します。

ちょっと先走って、人間が赤とか紫とか認識すると書きましたが、人の目に入ってきた光は角膜、水晶体を通過して網膜にあたります。網膜上には光に反応する受容体として桿体、錐体というものが存在します。この錐体に可視光内の長波長(赤)に反応するもの、中波長(緑)に反応するもの、短波長(青)に反応するものがあり、それぞれの錐体がどのくらい反応するかで光の色を認識することになります。

色の話になってしまって、PDFのCIEベースカラースペースの話まで進めませんでした。こういう色というものをコンピュータ上でどう表現するか、さらにPDFではどう表現するか、また続きを記載したいと思います。

PDFの色指定について
PDFの色指定の概要・デバイスカラースペース
PDFの色指定 (3)CIE1931 CIELuv CIELAB
CIEカラースペース
PDFの色指定(4)
ICCプロファイル
PDEの色指定(5)CIEベースカラースペース
PDFのCIEベースカラースペース格納形式と使用のされ方の概略



瞬簡PDF 作成 2024
ドラッグ&ドロップでPDF作成


アウトライナー
PDFを解析して しおり・目次を自動生成

PDFの色指定について

これまで、PDFの関連仕様としてPDF/X,PDF/A などについて説明してきました。これらの各仕様の中には「カラーの再現性を保証」するために、PDFがサポートする各種カラースペースに対して制限を設けているものがありました。たとえば、PDF/X-1およびPDF/X-1aでは、使用できるカラースペースをCMYK(およびグレースケール)に限定しています。今回からPDFで使用できる色について、説明してみたいと思います。

PDFのカラー機能
まずPDFのカラー機能ですが、色を指定する機能と色を描画する機能に分けられます。
色を指定する機能
ページコンテンツの文字、線、画像、あるいは、ページコンテンツ以外のしおり、注釈といった各種オブジェクトに対して色を指定する機能になります。
色を描画する機能
色の変換やガンマ補正などを行ってPDF内に指定されている色を表示する機能です。

PDFの作成者側では、PDF内の各種オブジェクトに対して色を指定し、PDFの表示・印刷などの使用者側では、指定された色を解釈し、対象のデバイスで使用可能な機能を用いて指定された色を再現することになります。PDFの色指定には様々な方法が用意されています。表示する特定のデバイスに依存しない方法で色を指定することもできます。

PDFのカラー指定
次にPDFでカラーを指定する方法を見ていきたいと思います。
カラー値
PDF内での色の指定方法は各種存在しますが、通常、カラースペースを指定し、カラースペースによって決まるカラー成分毎に値を指定することになります。たとえば、RGBカラースペースであればカラー成分はR,G,Bの3成分を持ちますので、カラースペースとしてRGBを指定したのち、これらの各成分に対応する3種類の値を指定することになります。
カラースペース
PDFで使用されるカラースペースの説明に入ります。PDFのカラースペースは大きく3種類のカテゴリに分類されます。

  • デバイスカラースペース
    • DeviceGray
    • DeviceRGB
    • DeviceCMYK
  • CIEベースカラースペース
    • CalGray
    • CalRGB
    • Lab
    • ICCBased
  • 特殊カラースペース
    • Pattern
    • Indexed
    • Separation
    • DeviceN
デバイスカラースペース
出力デバイス上の表現に直接関係するカラー値を指定します。一番簡単な指定方法ですが、同じ指定をしても出力デバイスが異なれば違った色に見えることが多いという欠点もあります。

  • DeviceGray
    無彩色の光の輝度を白と黒の比率で制御します。カラー値の成分は1つであり、黒 0 ~白 1の範囲で表現されます。
  • DeviceRGB
    加法混色の3原色 赤・緑・青(R,G,B)を成分に持ち、各成分の値を 0(成分無)~1(最大輝度)で表現します。黒(0,0,0) ~白(1,1,1)となります。
  • DeviceCMYK
    減法混色の4原色 シアン、マゼンタ、イエロー、ブラック (C/M/Y/K)を成分に持ち、各成分の値を0(その成分無)から1(最大濃度)で表現します。白(0,0,0,0)から黒(1,1,1,0) となります。成分Kは、理論的には不要ですが、CMYのインクを混合して黒を生成するより黒インクを使用するほうが印刷上、きれいな黒が表現されるために使用されます。(0,0,0,1)も黒となります。

PDF内で、各カラースペースを混在して指定することができます。たとえば黒でABCと3文字表示されていても「A」はDeviceGrayの0、「B」はDeviceRGBの(0,0,0)、「C」はDeviceCMYKの(1,1,1,0)という場合もあり得ます。(PDF/XやPDF/Aではこのあたりの混在使用を禁止しています)

次回、CIEベースカラースペースについて説明したいと思います。

PDFの色指定について(2)
色とは何か
PDFの色指定 (3)CIE1931 CIELuv CIELAB
CIEカラースペース
PDFの色指定(4)
ICCプロファイル
PDEの色指定(5)CIEベースカラースペース
PDFのCIEベースカラースペース格納形式と使用のされ方の概略



瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識


瞬簡PDF 作成 2024
ドラッグ&ドロップでPDF作成

PDF/A-1aのタグの見方

今回は PDF/Aの作成方法(準拠レベルA) でAcrobat/Wordが出力したPDF/A-1aの内容、主にタグ部分について少し見てみたいと思います。
レベルAではレベルBが持たない情報である文書の論理構造、言語などの情報を持つ必要がありました。PDFでは、文書の論理構造を表現するためにタグと呼ばれる仕組みを用意しています。
このあたりをつかって元文書がどのように表現されているか、Wordで簡単なサンプル文書を作成して、PDF/A-1aに変換したものを見てみます。

Word文書

Word文書

章、節、項の部分はWordの組み込みスタイルである「見出し1」~「見出し3」を使用し、
リスト番号を付加したものです。他に、箇条書き、表、画像 などを入れてみました。

Acrobat XIでは 「表示メニュー」の「表示切り替え」-「ナビゲーションパネル」-「タグ」とすることで、ドキュメント内につけられているタグの様子を見ることができます。左側にタグが階層表示され、ここをクリックすると本文内の対応する箇所がハイライト表示されます。
Word 2013で「PDF/A」および「アクセシビリティ用のドキュメント構造タグ」を指定して作成したPDFの場合
PDFの場合
このように表示されます。

一方、Word 2013から Acrobat XIのWord用PDFMakerでPDF/A-1aを指定して作成したPDFの場合
2013-12-06-03
となりました。

主なところだけ展開したキャプチャです。似たような構造ですが、タグの名前をはじめとして、細部では若干タグのつけ方も異なっていることがわかります。

PDFMakerでは「見出し1」など、Wordのスタイル名をそのままタグ名に使用しています。これら独自のタグ名をPDF仕様が用意している標準的なタグ名に割り当てる「ロールマップ」という仕組みがPDFに用意されていて、Acrobatでも表示させることができます。
ロールマップ

これを参照すると、スタイル名の「見出し1」を標準タグの「H1」に対応づけていることがわかります。

このような形でタグを使用して元文書の論理構造をPDFで表現します。

また、比較のために、Wordの「見出し1」などのスタイルを使わずに、表示だけ似たような形の文書を作成してPDF/A-1a出力してみます。
スタイルを使わない場合
ここの 章番号 1. 、1.1.1 などはWordのリスト番号ではなく、通常のテキスト入力したものです。
PDF/A-1aに変換した結果のタグを見てみます。
結果
これはWordのPDF保存の場合ですが、このように、こちらでは文書構造を取得するヒントとなるものが存在しないため、単純に〈P〉タグだけで出力されていることがわかります。

以上、簡単なタグ付け内容の参照方法となります。




瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品!


HTML on Word
WebページをWordで作る!
Pages: Prev 1 2 3 Next