カテゴリー別アーカイブ: PDF の仕様

【PDFテックの知恵袋】PDFの透かしとはどのようなものですか。透かしの活用法にはどんなことがありますか。

PDFの透かしは、PDF文書のページ上に独立して表示される文字や画像のことを指します。透かしは、テキスト、画像、PDF文書、色の4種類があり、ページ番号の範囲を指定して繰り返し配置したり、Zオーダー(前景か背景か)を指定したりすることができます。また、透かしの不透明度や表示・印刷の有無を設定することも可能です。

透かしの活用法

PDFの透かしを使用するメリットとして、以下の点が挙げられます。

  1. ブランドの一貫性: 会社のロゴやレターヘッドを透かしとして使用することで、文書全体にブランドの一貫性を持たせることができます(参考情報)。
  2. セキュリティと著作権保護: 透かしを使用することで、文書のコピーや不正使用を防ぐための視覚的な抑止力を提供します。
  3. カスタマイズ性: 透かしの倍率や配置、透明度などを細かく設定できるため、文書のデザインに合わせたカスタマイズが可能です(参考情報)。
  4. 編集可能性: Acrobat互換の透かしを使用することで、Acrobat上で透かしを編集・加工することが可能になります(参考情報)。
  5. 印刷設定: 透かしを印刷するかどうかを指定できるため、印刷時にのみ表示される透かしを作成することも可能です(参考情報)。

これらの機能により、PDFの透かしは文書の保護やブランド強化に役立ちます。

Acrobat互換の透かし

透かしはPDFの標準仕様(ISO 32000)で標準化されている機能ではないので実現方法は、ツールによって異なります。

PDF Tool APIでは、ISO 32000-1のオプショナルコンテント機能を利用して透かしを実装しています。また、Acrobat互換の透かしを設定することもできます。

Acrobat互換の透かしとは、Acrobat上で透かしとして認識され、加工・編集が可能な透かしのことです。具体的には、テキスト透かしの書式設定において、下線を引く機能や複数行のテキストの行揃えオプションを指定することができます。これらの機能はAcrobat互換透かしでのみ利用可能です。また、Acrobat互換の透かしを設定することで、出力されたPDFに含まれる透かしはAcrobat上で編集可能になります。ただし、Acrobat非互換のプロパティを設定するとエラーが発生するため注意が必要です。

詳しくは以下のURLをご参照ください:

過去3回分

10月3日 【PDFテックの知恵袋】PDFの注釈機能とはどんな機能ですか。注釈とPDFの本文テキストや画像との違いはどんなことでしょうか
10月4日 【PDFテックの知恵袋】PDFのフォント埋め込みとはどんなことですか?
10月7日 【PDFテックの知恵袋】PDFフォームとはどのような機能ですか?




瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品!


アウトライナー
PDFを解析して しおり・目次を自動生成

【PDFテックの知恵袋】PDF/A ファイルとは?

PDF/Aは、PDFの表示機器が変わっても表示される内容・色・見栄えは変わらずに再生表示できることを目的とする国際標準規格(ISO19005)です。近年は公文書の保存だけでなく、請求書などの証憑書類や工業製品の設計書面にも使われるようになっています。

PDF/Aファイルには制定された時期、ベースとなるPDFバージョンなどによってA-1からA-4までの種類があります。

  1. PDF/A-1: ISO 19005-1
    • PDF 1.4をベースにした最初のPDF/A規格
    • ファイル添付(埋め込み)禁止
  2. PDF/A-2: ISO 19005-2
    • 国際標準規格 ISO 32000-1(PDF 1.7)をベースにした規格
    • PDF/Aに準拠するPDFに限り、ファイルの添付が使用可能
  3. PDF/A-3: ISO 19005-3
    • PDF/A-2をもとに拡張した規格
    • あらゆる種類のファイル添付ができる(例:PDFの元になった電子文書ファイルの埋め込み)
  4. PDF/A-4: ISO 19005-4
    • ISO 32000-2(PDF 2.0)がベースの規格(PDF/A-3の進化版)
    • ファイル添付、フォームフィールドや3Dコンテント、JavaScriptのアーカイブ、PAdESの簡素化

対応する規格の詳細は以下のリンクから確認できます:
1. [PDF/A](『PDF CookBook』)
2. PDF/Aとはなにか(PDF資料室)
※PDF資料室の記事はPDF/A-3までの説明となっています。




アウトライナー
PDFを解析して しおり・目次を自動生成


瞬簡PDF 作成 2024
ドラッグ&ドロップでPDF作成

PDFの色指定(5)CIEベースカラースペース

PDFにおけるCIEベースカラースペースは初回に紹介したように次の4つです。

  • CalGray
  • CalRGB
  • Lab
  • ICCBased

デバイスカラーベースと異なり、出力デバイスに依らず色を指定できます。出力時の処理では内部でXYZの3値による表現に変換され、このXYZがデバイスカラースペースに変換されます。そこからはデバイスカラースペースと同様に処理されます。

CalGrayはグレースペースの要素Aを用います。Aは0.0~1.0の値を取ります。値AをMatrix Aを使用しLMNの3値にデコードします。このLMNをそのままXYZとして使用します。
このMatrix Aを構成する値が、CalGrayに辞書型で格納される、CIEXYZに基づく白の基準値WhitePointと、黒の基準値BlackPointの3つの数値からなる配列と、輝度補正に使うGammaです。WhitePoint以外はオプションで、指定しなければ既定値を使用します。白と黒の基準値は、それぞれdiffuse white point、diffuse black pointと呼ばれるものです。

CalRGBでは入力値が増えます。CalRGBにに格納する辞書型は、GammaがRGBに対応する3値の配列になる他、Matrixというキーで3×3の行列が格納でき、XYZへ変換するときに補正値として用います。

PDFにおけるCIEベースカラースペースでのLabは正しくはCIE LABの方です。辞書型WhitePoint、BlackPointと、Rangeというa*、b*をそれぞれの最大値、最小値で指定する4つの数値の配列を格納しています。

最後にICCBasedカラースペースについてです。ICCカラープロファイルをストリーム型として格納できます。
追加として、サポートしていないデータがあった場合などに代替される設定名の配列Alternateや、ICCプロファイルで記述されているCoulor Componentの数Nを辞書型で格納します。PDF1.7ではICC. 1:2004-10に対応しています。

デバイス依存の色指定を、comformingなPDF writerは、機械的にCIEベースカラースペースに変換するよう要求できるとあります。

ISO 32000-1:2008にはこれらの詳細が数式・図表付きで記述されています。

参考

ISO 32000に準拠するPDFってどんなもの?


PDFの色指定について
デバイスカラースペース
PDFの色指定について(2)
色とは何か
PDFの色指定 (3)CIE1931 CIELuv CIELAB
CIEカラースペース
PDFの色指定(4)
ICCプロファイル



瞬簡PDF 変換 2024
PDFをOffice文書へ高精度変換


瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識

PDFの色指定(4) ICCプロファイル

前回、CIE1931、CIELAB、CIELUVについて触れました。
これらを活用し、様々なデバイスで色について統一的にマネジメントするための仕組みがICCプロファイルです。

International Color Consortium(ICC)[1]は、コンピュータやデジタルカメラ、スキャナ、プリンタなどのデバイス上で統一して色の管理を行うための標準化団体です。ベンダー8社を中心に1993年に設立されました。

ICCプロファイルは基準となるカラースペースの定義と、それに基づく設定の記述によって構成されています。基準となるカラースペースはプロファイル接続空間(PCS)と呼ばれます。これは、CIEXYZやCIELABによるカラースペースに制限を加え、プロファイルに使用しやすいようにしたものです。PCSという共通のカラースペースがあることで、あるデバイスでの色の記述を、そのデバイスのプロファイルを使いPCSの色表現に変換し、それを別のデバイスプロファイルを使って別のデバイス上での色の記述に変換できます。またICCプロファイルには、色の記述をPCSでの色表現に変換するための共通のインターフェースという役割があります。
このインターフェースは、先に挙げたPCSとPCSに色の記述を変換する設定の書式を厳密に定めたもので、構造としては、ヘッダ部、タグのテーブル、タグに紐付いたデータで構成されます。変換アルゴリズムなどの実装については定めていません。

PCSからデバイスの色に変換する際に、そのままではデバイスで対応できない色が含まれる場合があります。そのときに対応していない色をどの色にマッピングするかを定める「レンダリングインテント」と呼ばれるものをICCプロファイルに用意できます。

caption: PCS

ICCプロファイルは、デバイスによって幾つかの種類に分けられます。主に次の3つです。

  • スキャナ、デジタルカメラなどのための入力プロファイル
  •  ディスプレイなどでの表示のためのディスプレイプロファイル
  •  プリンタなどのための出力プロファイル

他の種類もあります。

  • 画像形式での流通のためのカラースペースコンバージョンプロファイル
  • 特定の色のための命名色プロファイル
  • 追加の補正情報を埋め込むためのアブストラクトプロファイル

さらに、プロファイルを組み合わせて1つにした、デバイスリンクプロファイルがあります。

相互に色を変換するための共通の書式であるICCプロファイルについて概要を説明しました。
次回はようやく、PDFのCIEベースカラースペースについての回になる予定です。

[1] http://www.color.org/abouticc.xalter

PDFの色指定について
PDFの色指定の概要・デバイスカラースペース
PDFの色指定について(2)
色とは何か
PDFの色指定 (3)CIE1931 CIELuv CIELAB
CIEカラースペース
PDEの色指定(5)CIEベースカラースペース
PDFのCIEベースカラースペース格納形式と使用のされ方の概略



アウトライナー
PDFを解析して しおり・目次を自動生成


瞬簡PDF 作成 2024
ドラッグ&ドロップでPDF作成

PDFの色指定 (3)CIE1931 CIELuv CIELAB

前回、人体が色を認識する仕組みについて解説しました。
PDFのCIEベースカラースペースについて知るには、
CIEのカラースペースについての知識が必要です。
特に重要となる、CIE 1931、CIELAB、CIELuvについて紹介します。

用語

CIE
光、照明、色、色空間についての標準化団体となります。CIEによって採択されたものにもCIEが頭につきます。
カラースペース(色空間)
色を成分に分け座標軸とし、その分布を空間として定義したものです。成分の取り方や距離の取り方、空間の作り方によって様々に定義されます。
知覚的均等
カラースペースの文脈では、座標の目盛の距離と、人間の知覚する色の変化の度合いの対応がより一致する、ということです。このように設計されたカラースペースを均等色空間と呼びます。
色の三属性
色相、彩度、明度という色を表すための尺度です。
色度
色相、彩度による色の分布になります。
マンセル表色系
マンセルによって考案された、色の三属性を人間の知覚に合わせて区分した、色を表す体系です。

CIE 1931

CIEによって、
1931年にCIE 1931が採択されました。
CIERGBとCIEXYZの2つがあります。
はじめて物理的な色(つまり電磁波の波長)と、
心理学的な人間の色覚としての知覚色の関係について、基準が決められました。
電磁波の波長は前回に述べた目の細胞によって、色として認識されます。
その波長による刺激と、知覚される色の対応を調べる実験結果から導出されました。
試験色と同じ色を、赤青緑の代表となるそれぞれの波長の強さを変えながら
表現する実験でした。

赤緑青色を混ぜただけではどうしても作り出せない色があり、
負の値を与えることで、単純な合成では作り出せなかった色を表現することになりました。
実験としては、試験色側に色を混ぜることで実現しました。
これを基にCIERGBが誕生しました。

負の値は、計算をする際の複雑さの一因となります。
特に手計算では歓迎されないものでした。そのために、
負の値を取らない座標の取り方が考案されます。
また、波長の輝度の取り方についても、CIERGBでは軸のそれぞれで比率を考慮する必要がありました。
これを計算し、新しい空間XYZではYが輝度として使えるようにしました。
CIERGBに、そういった計算簡略化の仕組みが
導入されたものがCIE 1931 XYZ(CIEXYZ)となります。

CIELAB

Hunter 1948 L, a, b(Lab)

Labは明度Lと、マゼンタと緑の中間色a、
黄色と青の中間色bによるカラースペースです。
CIEXYZに基づきます。

マンセル表色系に影響されており、
CIEXYZよりも知覚的均等とされています。
また、Lは人間の明度の知覚と極めて近しいものとして扱うことができ、
色の調整を感覚的に行えます。

CIE 1976 L*, a*, b* (CIELAB)

CIELABは、明度を表わすL*、
マゼンタと緑の中間位置を表すa*、
黄色と青の中間位置を表すb*に対応した座標を持ちます。
L*、a*、b*はHunter 1948 LabのL、a、bと少し異なることを
「*」によって明示しています。L* = 0は黒、L* = 100は
白の拡散色とされています。a*は正の値がマゼンタ、負の値が緑寄り、
b*は正が黄色、負が青寄りです。

CIELuv

CIE 1960

色度を座標(u,v)で表す、色度空間になります。

CIE 1964(CIEUVW)

CIEUVWはU* V* W*の3値を使うもので、
CIE 1960を基にしています。
W*はCIEXYZにおけるYを輝度として計算される明度の値で、U*, V*はそれぞれ
(u0, v0)をWhitePointとした値、CIE 1960の(u,v)点、W*から計算した値になります。

以前に考案されたカラースペースよりも、
より知覚的均等であるように考案されました。

CIE 1976 (L*, u*, v*) (CIELuv)

これは、CIEUVWを発展させたものといえます。
(u*, v*)はCIEUVWカラースペースとは値の取り方に違いがあることを
明示しています。

CIELABとCIELuvの関係

CIELABとCIELuvは、CIEXYZを基に、異なる観点から知覚的均等を意識して
考案され、1976年に同時に採択されました。
一方のCIELABは、CIELuvと比べ照明光による影響の少ない色指定を行えることから、
印刷などに使用されます。
他方のCIELuvはコンピュータディスプレイなど、発色する光が関係する分野で使用されます。
また、両者ともCIEXYZへの変換が可能です。
つまり、印刷向きの色指定とディスプレイ向けの色指定の対応付けが可能となります。
次回はこの点が係わる、ICCプロファイルについての紹介を予定しています。

PDFの色指定について
PDFの色指定概要・デバイスカラースペース
PDFの色指定について(2)
色とは何か
PDFの色指定(4)
ICCプロファイル
PDEの色指定(5)CIEベースカラースペース
PDFのCIEベースカラースペース格納形式と使用のされ方の概略

5/22 正確でない表現だった箇所を削除しました。




瞬簡PDF 編集 2024
かんたん操作でPDFを自由自在に編集


瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識

PDF2.0のタグ事情

PDF2.0の仕様が策定されてから暫く経ちましたが、PDF1.x系 とタグ関連の違いについて述べたいと思います。以下の要素の変更がありました。

廃止された要素

  • Sect
  • Art
  • BlockQuote
  • TOC
  • TOCI
  • Index
  • NonStruct
  • Private
  • Quote
  • Note
  • Reference
  • BibEntry
  • Code

追加された要素

  • DocumentFragment
  • Aside
  • Hn (where n > 6)
  • Title
  • FENote
  • Sub
  • Em
  • Strong
  • Artifact

廃止になった要素をどの様に代替するのかを考えると、Sect は Part で置換、Art は Aside で置換、Note は、FENote で置換できそうです。
Reference に関しては、要素の辞書に Refが追加されたので、それを使えば良いと思われます(読み上げ機能を考えると単純に置き換えて上手く行くかは疑問に残りますが…)。

他の要素に関しては、HTML にある要素は、Namespace を設定すれば、今まで通り使える可能性も有りますが、基本的に置換が難しいです。
PDF2.0 のタグを使わず、当面は Namespace を設定して PDF1.x系 の仕様のままタグ付けるのが、無難な気がしてきました。




瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品!


瞬簡PDF 作成 2024
ドラッグ&ドロップでPDF作成

Next Generation PDF について(2)

Core concepts and use cases

キーノートでは詳しいことが分からなかったので、このセッションのスライドを読んでみました。

ここでは「next-generation PDF」を処理する「next-generation processor」という用語が出てきます。その役割は「タグ付きPDFからの導出(Derivation):PDF コンテンツを HTML で表現するための標準化されたモデル」と書かれています。
どうやら、HTML にうまく変換できるような標準化されたタグ付けのモデルとその変換アルゴリズムを定めて、予測可能で互換性のある方法で HTML に変換しよう、ということのようです。

そして、HTML に変換してから端末に応じたスタイルシートを適用することで、既にモバイル環境に対応した Web のテクノロジーを利用して、PDF のコンテンツをモバイル環境で利用できるようにする、という目論見のようです。

PDF から HTML に変換する製品は現時点でも既にあるようで、後のセッションでも紹介があります。標準化された方法でより正確に出来ることを目指そうということでしょうか。

また、ユースケースでは、アクセシビリティの観点からの解説がありました。

U.S. や EU 等の政府機関ではアクセシビリティが要求されますが、既存のスクリーンリーダーなどの Assistive Technology(障害を持つ人々を支援する機器や技術)は HTML をサポートするが、PDF はほとんどサポートされない状況があります。一方で PDF は電子文書としての信頼性と互換性が確立されているので、政府機関は PDF を諦めたくはない。

アクセシビリティの準拠基準は、W3C の WCAG (Web Content Accessibility Guidelines) 規格の達成基準レベル「AA」を条件として示されるようですが、この規格は Web を前提としたもので HTML には適用しやすいが、PDF には直接的に適用しにくいので、PDF が HTML として表現できれば WCAG への適合を判定しやすい、ということが説明されています。

今後 PDF がどのように発展していくのか。「PDF Day Europe 2017」での動向をご紹介しました。参考になれば幸いです。

<< その(1)




アウトライナー
PDFを解析して しおり・目次を自動生成


瞬簡PDF 作成 2024
ドラッグ&ドロップでPDF作成

Next Generation PDF について(1)

5月15, 16日にドイツのベルリンで開催されたイベント「PDF Day Europe 2017」のスライドやビデオが公開されていました。

https://www.pdfa.org/slides-and-video-recordings-of-the-pdf-days-europe-2017/

PDF2.0 の情報があれば見ておこうと思い Web サイトを訪れたのですが、「Next Generation PDF」という見慣れないワードを見つけました。最初は PDF2.0 のことかと思ったのですが違うようです。初日のキーノートと、3トラックのうち1トラックが「Next Generation PDF」に充てられています。気になり少し調べてみました。

KEYNOTE: Introducing Next-Generation PDF

スライドを見ると、最近のモバイル端末での PDF の閲覧や操作性の問題を課題としているようです。PDF は電子文書フォーマットとして広く普及していますが、モバイル端末環境となると閲覧や操作にかなり不満がありますね。特にスマートフォンでは閲覧するだけでも拡大縮小したり移動したりで大変です。PDF リーダーによっては実装されているリフロー表示もうまく使えないことが多いです。

モバイル端末しか使わないユーザーが急増する中で、Web の世界ではレスポンシブ web デザインやモバイルファースト等、積極的にモバイル環境への対応が進んでいますが、PDF もモバイル端末環境に対応すべく、イベントの主催者である PDF Association のテクニカルワーキンググループで「Next Generation PDF」なるものを検討している、ということのようです。

では「Next Generation PDF」とはどんなものなのか。スライドによると、

  • フル機能の PDF2.0
  • うまくタグ付けされた PDF

と書いてあります。PDF2.0 をベースにした規格になるのでしょうか。

「タグ付きPDF」は、例えば段落、表、ヘッダといった文書の構造情報を PDF に付加するための仕様です。PDF のページは単に文字や線や画像が並べられて見た目が構成されているだけなので、それらが段落、表、ヘッダなど何を表すのかプログラムは正確に判定できず推測するしかありません。そのため、スクリーンリーダーで正しい順序でテキストを読めない、PDF リーダーのテキストリフロー表示がうまくできないといったことが起こります。この問題は「タグ付きPDF」にすることでより正確にできるようになります。
「タグ付きPDF」は PDF1.4 から導入され ISO32000-1(PDF1.7)の仕様の一部ですが、PDF2.0 で見直されることになっています。

キーノートはここまででした。詳しくはあとのセッションでということです。
明日は「Core concepts and use cases」を読んでみたいと思います。

その(2) >>




瞬簡PDF 変換 2024
PDFをOffice文書へ高精度変換


瞬簡PDF 編集 2024
かんたん操作でPDFを自由自在に編集

Acrobat の不満点(その2)

前回 に引き続き、Acrobat の不満点を書いてみます。

Acrobat にて PDF を作成し、印刷も視野に入れていたため CMYK の ICC Profile を出力インテントに指定して PDF/A-2 形式で保存しました。

PDF/A-2 ではベースバージョンが PDF1.7 となったため、PDF1.4 というベースバージョンの制約があった PDF/A-1 と比べて非常に有効なバージョンになります。
以下は PDF/A-2 によって実現可能となった機能の一部です。

  • PDF 1.4 -> PDF 1.5
    JPEG2000圧縮によるイメージ
    オブジェクトストリーム、Xrefストリーム(圧縮率の向上)
    オプショナルコンテント
    XFA Form
  • PDF 1.5 -> PDF 1.6
    暗号化機能の強化(AES暗号化の追加)
    カラースペース追加(DeviceN、NChannel)
  • PDF 1.6 -> PDF 1.7(ISO 32000-1)
    3Dアートワーク
    ポータブルコレクション

PDF/A-2 の詳細につきましては、PDF資料室 過去のブログ にまとめておりますので、参照ください。

さて、PDF/A-2 で保存した結果、出力された出力インテントが RGB の ICC Profile に置き換わってしまいました。
作成した PDF にはテキスト注釈、スタンプ注釈といった注釈が含まれていたのですが、この事が原因で強制的に RGB となってしまったのでしょうか。
PDF/A-2 の仕様では CMYK が使用できない、といった制限はありませんので、不思議な結果となりました。
CMYK の ICC Profile を出力する方法はあるのでしょうか。

<< その(1)




瞬簡PDF 作成 2024
ドラッグ&ドロップでPDF作成


瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識

Acrobat の不満点(その1)

日頃 PDF ファイルの編集作業で Adobe Acrobat を使用する機会が多いのですが、使用している中で不満に感じている事を書いてみます。

PDF では対話フォーム(AcroForm)と呼ばれる、使用者から対話的に情報を収集するフィールドを持つことができます。
その中にはテキストフィールド、ラジオボタン、リストボックスといった使用者が入力するフィールドや、ボタンのようにアクションを関連付けて特定のページへジャンプするようなアクションを指定することができる便利な機能です。Acrobat では「ツール」の「フォーム」にて作成可能です。

この機能は PDF1.2 以降で使用可能な機能なので、使用している方も多いのではないでしょうか。

さて、この対話フォーム(AcroForm)を使用した PDF を作成し、PDF/A(*1) へ別名保存してみます。 ところが PDF/A として保存した PDF で、表示上はボタンの画像やテキストボックス風のエリア、ラジオボタン風の円が残るのですが、マウスクリックしても全く機能しません。
Acrobat では PDF/A 保存すると、外観だけを残して対話フォーム(AcroForm)の機能自体を削除してしまうようです。

確かに長期保存する文書で使用者との対話は不向きなのかもしれませんが、ボタンでのページ移動等のように便利な機能もあるので削除してしまうのは惜しいと感じています。

(*1)
PDF/A(ISO 19005の同義語)は、国際標準化機構 ISO が制定した国際規格 ISO 19005 に定められる PDF の形式の1つです。このファイル形式の第一の目的は、使用するツールにかかわらず、長期間に渡ってファイルの視覚的な外観を維持できること、第二の目的は、PDF の視覚的な外観ではなく、論理構造、意味といった情報を格納できるようにすることにあります。
PDF/A につきましては、PDF資料室過去のブログ にまとめておりますので、参照ください。

その(2) >>




アウトライナー
PDFを解析して しおり・目次を自動生成


瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識
Pages: 1 2 3 Next