カテゴリー別アーカイブ: PDF のあれこれ

【PDFテックの知恵袋】 PDFのファイルサイズを小さくする方法としてどんなことがありますか。

PDFのファイルサイズを小さくする方法として、以下の方法があります。

  1. 画像の最適化: 画像のダウンサンプリングや圧縮形式の変更を行うことで、PDFのファイルサイズを小さくすることができます。具体的には、カラー画像、グレースケール画像、モノクロ画像ごとに最適化を行い、圧縮形式や圧縮の具合を調整します。
  2. 不要な機能の削除: PDFから不要なJavaScriptアクションなどの機能を削除することで、ファイルサイズを削減できます。

これらの方法を組み合わせることで、PDFのファイルサイズを効果的に小さくすることが可能です。

画像の最適化の方法

画像の最適化の方法能については、以下の情報が参考になります。

ダウンサンプリングは、画像の解像度を下げることでファイルサイズを小さくするための手法です。PDF Tool APIでは、ダウンサンプリングの条件として以下のような設定が可能です。

  • ダウンサンプリングを行うPPI値の設定(例: 150 PPI以上の場合にダウンサンプリングを実施)
  • ダウンサンプリング後のPPI値の設定(例: 75 PPI)
  • ダウンサンプリング方法の選択(例: バイキュービック法)
  • ダウンサンプリング率の下限値の設定(例: 0.65)

これらの設定を行うことで、画像の最適化を行い、PDFのファイルサイズを効率的に管理することができます。

詳しい情報は以下のURLから確認できます。

必須ではない機能

PDFファイルの中の必須ではない機能としては、オープンアクション、しおり、注釈・フォーム、アーティクル、サムネールなどがあります。これらはPDF Tool APIを使用して最適化の際に削除することが可能です。また、JavaScriptアクションもオプションとして削除することができます。これにより、PDFの安全性を高めることができます。

過去3回分

10月7日 【PDFテックの知恵袋】PDFフォームとはどのような機能ですか?
10月10日 【PDFテックの知恵袋】PDFの透かしとはどのようなものですか。透かしの活用法にはどんなことがありますか。
10月11日 【PDFテックの知恵袋】PDFへの画像追加と印影追加は何が違いますか。印影追加にはどんな方法がありますか。




HTML on Word
WebページをWordで作る!


瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品!

『アウトライナー』で編集して、PDF出力で作成したPDFは、任意のPDFアプリで表示したり編集できます

弊社の『アウトライナー』は、PDFファイルを読み込んで、しおりを付けたり、リンクを設定したり、あるいは複数のPDFファイルを結合したりするWindowsアプリケーションです。

『アウトライナー』を評価中のお客様から次のような質問がありました。

『アウトライナー』でPDFに設定したしおりやリンク、あるいは『アウトライナー』で分割したり、結合したりして作成したPDFを、ほかの人に渡すときは『アウトライナー』がなくても大丈夫でしょうか?

もちろん、答えは、

PDFだけ渡せば大丈夫です。『アウトライナー』がなくても、だれでもそのPDFを表示したり、編集したりできます。

たとえばMicrosoft Wordで作成した文書ファイルをデジタルで他の人に渡したとき、原則として受け取った人がWordをもっていないと表示したり、編集したりできません。

しかし、PDFファイルはWord文書ファイルとは違って、作成したアプリケーションソフトがなくても、扱うことができるようになっています。

WordファイルとPDFファイルが、なぜこのように違うのか、初心者がその理由を理解するのは難しいかもしれません、当面、PDFファイルはそのようなものだと覚えておくのが良いかもしれません。




瞬簡PDF 作成 2024
ドラッグ&ドロップでPDF作成


瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識

PDF対話フォームってご存じですか? PDF対話フォームを使えば、登録・申請の仕組みを簡単にデジタル化でき、効率もあがります

昨年2020年より官民の大きな課題としてますます注目が集まるデジタルトランスフォーメーションことDX。アンテナハウスPDFでは、PDF対話フォームを登録や申請業務分野のDX推進のための一押し機能と考え、諸施策を進めております。次にPDF対話フォーム関連情報の一部をご案内いたします。

まず、2021年1月12日開催された、今年初のちょっと一息アンテナハウスウェビナーではPDF対話フォームへの大きな期待を語りました。

当日のウェビナーの録画をYouTubeに公開しております。

YouTube:【vol.1】申請・登録のデジタル化の現状と課題

行政分野で日々行われる申請・登録業務ですが、いまだに窓口でのやりとりが不可欠なのが現状です。どうしてオール電化ならぬ、オールデジタル化に至らないのでしょうか。考察します。

YouTube:【vol.2】誰でも直接記入できるPDF対話フォーム

申請・登録のデジタル化として、Webアプリケーション化が考えられますが、開発やメンテナンスにかかるコストから現実的ではありません。そこで、PDF対話フォームを使うというのを考えてみます。

YouTube:【vol.3】PDF対話フォームの活用を考える

PDF対話フォームの活用は、ちらほらみられるものの、ほとんど普及していないのが現状です。ここでは、PDF対話フォームの活用法や、広く普及させるためのアイディアを考えてみます。

また、先日は『瞬簡PDF書けまっせ8』を使って、PDF対話フォームを作成する動画をYouTubeにアップしました。

YouTube:3分で分かる! 「瞬簡PDF 書けまっせ 8」 対話フォームの作り方

「瞬簡PDF 書けまっせ 8」 ではPDFで入力可能な入力欄「対話フォーム」を 簡単に作成することができます。テキストフィールドやチェックボックス、ラジオボタンなど、様々なフォームフィールドの作り方を説明します。

来月:7月13日には、ちょっと一息アンテナハウスウェビナーのPDF対話フォーム編第2回目として、アンテナハウス製品の顧客登録用紙にPDF対話フォームを実際に応用した活用例をご報告いたします。

ちょっと一息・アンテナハウスウェビナーのご案内:7月13日16時より
PDF対話フォームで簡単・便利な登録更新!

PDF資料室:PDF対話フォームとはなにか? 申請のデジタル化にPDF対話フォームの活用を期待する

PDF対話フォームについての基礎的な解説文です。




瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識


瞬簡PDF 編集 2024
かんたん操作でPDFを自由自在に編集

Google Chrome開発者版(86)でタグ付きPDFを出力[8/4修正]

[8/4追記]社内で「Chrome出力ではなくAcrobat Readerの対応外のタグ使用によって表示が壊れている可能性がある」と指摘を受けました。記事内での表現を修正します。

当初の記事タイトルは「タグ付きPDFがGoogle Chromeのデフォルトに?」だったのですが、現状としては「今後Google Chromeでタグ付きPDF出力が可能になるかもしれない」あたりのようです。

今回使用した環境は次になります。

  • Windows 10 Home 1909
  • Google Chrome バージョン: 86.0.4221.0(Official Build)canary (64 ビット)
  • Acrobat Reader DC – Japansese (20.009.20074)
  • 検証に使用したページ*https://www.w3.org/TR/xsl11/

2020年8月リリースのGoogle Chrome 85から、タグ付きPDFの出力がサポートされます[1]。関連する情報発信自体は以前からあったようですが、実際にリリースされるこのタイミングで俄かに活気づいているようです。活気づいてますよね?

早速Google Chromeをサイトからダウンロードしてみましたが、バージョンを確認すると2020年8月3日時点では84のようです。Google ChromeにはCanaryバージョンがあるのでこちらをダウンロード。試験運用版ですので、同様に検証される方はくれぐれも自己責任でお願いします。(84でもExperimentalの設定として「Export Tagged PDF」を有効化できます。)

バージョンを確認。86……86ですね。85ではありませんが、検証には問題ないでしょう

この後Chrome 84でのtagged PDF出力も確認しましたが、同様の結果になりました。

タグ付きPDFとは

ざっくりとまとめると「タグ付きPDFは、内部に文書構造を指定するタグを付与したPDFのこと」になります。
通常PDFは印刷物のデジタル表現、つまり視覚的な表現として文書構造が見られればよいわけですが、
PDF内部のデータを別の目的で使うときにこの情報だけでは不足することがあります。
別の目的としては、データの読み上げ、PDFから他形式への再変換などがあります。

また、PDFをHTMLのようにリフローで表示したいときにも、タグを用いることで文書の表示順序などを壊さないようにできます。
「HTMLのように」と書きましたが、このタグ付きPDFで設定できるタグの多くはHTMLでのタグと類似したものになります。

概要は[2][3]、詳細は[4][5]をご覧ください。

新ビューアは今のところリフロー表示に対応していないらしい

Canaryだと、PDF出力オプションの他に「PDF Viewer Update」オプションがあるんですね。

chrome://flags/#pdf-viewer-update

これを有効化すると、84ではExperimentalのオプションである「PDF Two-up View」もついでに使えるようになります。

ウインドウ画面と表示をフィットさせる場合に上下と左右どちらを優先するか、回転表示、PDF注釈の表示のオンオフ、アウトライン表示など、色々改善がされていることがわかります。とはいえ、全体的なPDFの表示機能についてはまだまだ頑張ってほしいところです。

さて、タグ付きPDF対応と聞いて真っ先に期待してしまうであろうリフロー表示ですが、とりあえず86の新ビューアではできないようです。
「タグ付きPDFの出力」と「PDFのリフロー表示」は重なる部分もあるものの別の話なので、そういうこともありますね。
今回の新バージョンについて、ChromiumのブログにChrome Accessibilityのリーダーからコメントがあります。improving Chrome’s built-in PDF reader to better consume tagged PDFsとあるので、それなりに可能性はあるのではないでしょうか。
> While this is an important milestone, we’re not done. Future work includes both improving the quality of generated tagged PDFs, and also improving Chrome’s built-in PDF reader to better consume tagged PDFs.

タグ付きPDFをChromeで出力する

本題のタグ付きPDF出力です。Experimentalな設定で次を指定するとタグ付きPDFが出力できるようになるとあります。

chrome://flags/#export-tagged-pdf

では、PDFを出力してみます。*のページを「PDFで保存」します。さて、本来はこれをAcrobat Readerで開いてみて「おおー」となる予定だったのですが、「表示」「折り返し」を有効にしたAcrobat Readerでのリフロー表示がうまくいってないようです。

W3Cのページはあまり変なマークアップのHTMLはないはずです。タグ付きPDFは検証した日時でのGoogle ChromeとしてはExperimentalな機能なので、こちらが原因でしょうか。タグ付きPDFとリフロー表示についてはAcrobat Readerの対応状況も関連するので、Chromeの出力が原因ではないかもしれないとの指摘をいただきました。Google Chromeには自分の出力の正しさを証明するためにもPDFリフロー表示に対応してほしいですね。
PDFの内部を確認したい方は、アンテナハウスのデスクトップ製品『
瞬簡PDF 編集 9
』[6]付属の『タグ編集ツール PDFタグエディターVer.2』を使うとよいかもしれません。

他に数件確認してみましたが、ページが上のように壊れることはないものの、「いきなり何もかも上手く出力できる」とはいかないようです。Experimentalな機能なので詳細な検証をすることを避けました。

ちなみに、Chromeでのタグ付きでないPDF出力をAcrobat Readerの折り返し表示したときは、とりあえずは表示されています。

ちなみに、同じWebサイトをAntenna House Formatter V7.0 MR3でタグ付きPDFを出力した場合、折り返し表示でも問題はないようです(フォントサイズや余白、分割アルゴリズムの違いなどがあるので同じ条件にはなっていません。)。

ChromeでのHTMLとタグ付きPDFの補足資料

Chromiumのタグ付きPDF機能開発におけるデザイン資料[7]によればこれはマークアップを元にタグを付与するものなので(AIが何もかもやってくれるような話ではない)、求められるタグを出力できるかはページ製作者次第です。Chromeの開発過程で実際にはどうなったかは確認していませんが(資料中のメーリスやバグトラッカーを確認していけばよさそうです)、DOMツリーと描画用ツリー、そしてARIA属性などを基にした「Accessibility tree」を利用するデザインのようです。


The accessibility tree computed in Blink is another good possibility. The accessibility tree is derived from the DOM and the Layout Tree and also takes accessibility attributes such as ARIA attributes into account.
Chromium Tagged PDF Export Design Doc

We think the accessibility tree is the best fit and that’s the design proposed here.
Chromium Tagged PDF Export Design Doc

つまり出力が完璧だったとして、現在のところ多くのWebページについて実用的かと言われれば疑問の残るところ。残念ながら、ページによってはむしろ不要なノイズだらけになってしまうでしょう。[7]に次のようにありますが、こういった機能を機にアクセシブルなWebページを作ろうという気運が再燃したりすれば幸いです。

正常に出力されるページもあるかもしれませんが、現在Experimentalとある機能ですので、今回はここまでとします。

タグ付きPDFにご興味を持たれた方は、アンテナハウスのPDF製品を是非チェックしてみてください。


if you visit a web page that’s compliant with WCAG accessibility guidelines, then export it as PDF, then open that PDF in Chrome, the PDF in Chrome should have the same level of accessibility, modulo the limitations of a PDF file.Chromium Tagged PDF Export Design Doc

  1. [1] Using Chrome to generate more accessible PDFs – Chromium Blog
  2. [2] タグ付きPDFとはどんなもの
  3. [3] PDFのリフロー表示。タグ付きPDFとタグの付いていないPDFの比較。
  4. [4] 『タグ付きPDF 仕組と制作方法解説』
  5. [5] 『PDFインフラストラクチャ解説』
  6. [6] かんたん操作でPDFを自由自在に編集 瞬簡PDF 編集 9
  7. [7] Chrome Tagged PDF Export – Authors: dmazzoni[at]chromium.org
    November 2019





瞬簡PDF 変換 2024
PDFをOffice文書へ高精度変換


瞬簡PDF 編集 2024
かんたん操作でPDFを自由自在に編集

PDFの色指定(5)CIEベースカラースペース

PDFにおけるCIEベースカラースペースは初回に紹介したように次の4つです。

  • CalGray
  • CalRGB
  • Lab
  • ICCBased

デバイスカラーベースと異なり、出力デバイスに依らず色を指定できます。出力時の処理では内部でXYZの3値による表現に変換され、このXYZがデバイスカラースペースに変換されます。そこからはデバイスカラースペースと同様に処理されます。

CalGrayはグレースペースの要素Aを用います。Aは0.0~1.0の値を取ります。値AをMatrix Aを使用しLMNの3値にデコードします。このLMNをそのままXYZとして使用します。
このMatrix Aを構成する値が、CalGrayに辞書型で格納される、CIEXYZに基づく白の基準値WhitePointと、黒の基準値BlackPointの3つの数値からなる配列と、輝度補正に使うGammaです。WhitePoint以外はオプションで、指定しなければ既定値を使用します。白と黒の基準値は、それぞれdiffuse white point、diffuse black pointと呼ばれるものです。

CalRGBでは入力値が増えます。CalRGBにに格納する辞書型は、GammaがRGBに対応する3値の配列になる他、Matrixというキーで3×3の行列が格納でき、XYZへ変換するときに補正値として用います。

PDFにおけるCIEベースカラースペースでのLabは正しくはCIE LABの方です。辞書型WhitePoint、BlackPointと、Rangeというa*、b*をそれぞれの最大値、最小値で指定する4つの数値の配列を格納しています。

最後にICCBasedカラースペースについてです。ICCカラープロファイルをストリーム型として格納できます。
追加として、サポートしていないデータがあった場合などに代替される設定名の配列Alternateや、ICCプロファイルで記述されているCoulor Componentの数Nを辞書型で格納します。PDF1.7ではICC. 1:2004-10に対応しています。

デバイス依存の色指定を、comformingなPDF writerは、機械的にCIEベースカラースペースに変換するよう要求できるとあります。

ISO 32000-1:2008にはこれらの詳細が数式・図表付きで記述されています。

参考

ISO 32000に準拠するPDFってどんなもの?


PDFの色指定について
デバイスカラースペース
PDFの色指定について(2)
色とは何か
PDFの色指定 (3)CIE1931 CIELuv CIELAB
CIEカラースペース
PDFの色指定(4)
ICCプロファイル



瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品!


瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識

PDFの色指定(4) ICCプロファイル

前回、CIE1931、CIELAB、CIELUVについて触れました。
これらを活用し、様々なデバイスで色について統一的にマネジメントするための仕組みがICCプロファイルです。

International Color Consortium(ICC)[1]は、コンピュータやデジタルカメラ、スキャナ、プリンタなどのデバイス上で統一して色の管理を行うための標準化団体です。ベンダー8社を中心に1993年に設立されました。

ICCプロファイルは基準となるカラースペースの定義と、それに基づく設定の記述によって構成されています。基準となるカラースペースはプロファイル接続空間(PCS)と呼ばれます。これは、CIEXYZやCIELABによるカラースペースに制限を加え、プロファイルに使用しやすいようにしたものです。PCSという共通のカラースペースがあることで、あるデバイスでの色の記述を、そのデバイスのプロファイルを使いPCSの色表現に変換し、それを別のデバイスプロファイルを使って別のデバイス上での色の記述に変換できます。またICCプロファイルには、色の記述をPCSでの色表現に変換するための共通のインターフェースという役割があります。
このインターフェースは、先に挙げたPCSとPCSに色の記述を変換する設定の書式を厳密に定めたもので、構造としては、ヘッダ部、タグのテーブル、タグに紐付いたデータで構成されます。変換アルゴリズムなどの実装については定めていません。

PCSからデバイスの色に変換する際に、そのままではデバイスで対応できない色が含まれる場合があります。そのときに対応していない色をどの色にマッピングするかを定める「レンダリングインテント」と呼ばれるものをICCプロファイルに用意できます。

caption: PCS

ICCプロファイルは、デバイスによって幾つかの種類に分けられます。主に次の3つです。

  • スキャナ、デジタルカメラなどのための入力プロファイル
  •  ディスプレイなどでの表示のためのディスプレイプロファイル
  •  プリンタなどのための出力プロファイル

他の種類もあります。

  • 画像形式での流通のためのカラースペースコンバージョンプロファイル
  • 特定の色のための命名色プロファイル
  • 追加の補正情報を埋め込むためのアブストラクトプロファイル

さらに、プロファイルを組み合わせて1つにした、デバイスリンクプロファイルがあります。

相互に色を変換するための共通の書式であるICCプロファイルについて概要を説明しました。
次回はようやく、PDFのCIEベースカラースペースについての回になる予定です。

[1] http://www.color.org/abouticc.xalter

PDFの色指定について
PDFの色指定の概要・デバイスカラースペース
PDFの色指定について(2)
色とは何か
PDFの色指定 (3)CIE1931 CIELuv CIELAB
CIEカラースペース
PDEの色指定(5)CIEベースカラースペース
PDFのCIEベースカラースペース格納形式と使用のされ方の概略



瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識


アウトライナー
PDFを解析して しおり・目次を自動生成

暗号化されていてもPDFを開くときはご用心

暗号化されているPDFが送られてきてそのパスワードを知っていたら、作成者を信用して PDFを開いた後についつい不用心にPDFViewerの警告を無視していろいろと危ない操作をしてしまうかもしれません。しかし、2019年に、PDFのパスワードを知らないでもパスワードを変えずにPDFを色々と改変できてしまう脆弱性が発見されました(https://pdf-insecurity.org/index.html)

まだ脆弱性に対応していないPDFViewerもあるかもしれないので、外部からもらったファイルには細心の注意を払いましょう。




アウトライナー
PDFを解析して しおり・目次を自動生成


瞬簡PDF 編集 2024
かんたん操作でPDFを自由自在に編集

『Antenna House PDF Tool API』(PDF Tool API)でページ単位に分割してみる(2)

『Antenna House PDF Tool API』(PDF Tool API)は、PDFファイルの情報取得やPDFファイルの加工・編集を行うライブラリです。
PDFに関するさまざまな処理機能を搭載しています。
文書情報やページ数などの情報取得、ページの挿入や削除、透かしの挿入、セキュリティ設定などのファイル加工、ページコンテンツのテキストや画像の削除、画像の最適化(ダウンサンプリング)といったページ編集処理が可能です。

今回は『Antenna House PDF Tool API』(PDF Tool API)を使用して、複数ページのPDFを、1ページ単位に分割しながら、リンク注釈を設定します。
設定されたリンク注釈をクリックすると、前後のページのPDFを呼び出します。

Javaサンプルコード

Javaサンプルコード(ExtractPageAndLink)のダウンロード(ZIP)

入力元PDFから1ページ単位で取り出し、出力先PDFを生成します。
この時、入力PDFの文書情報を、出力先PDFに設定しています。
更に、前後ページのPDFファイルへリンク注釈を設定しています。

入力サンプルPDF(総ページ数3)

pdftool.6.0.sample

出力サンプルPDF(1ページ目)

次ページのPDFファイル(output_page_2.pdf)へのリンク注釈です。

pdftool.6.0.page1

出力サンプルPDF(2ページ目)

前ページのPDFファイル(output_page_1.pdf)へのリンク注釈です。

次ページのPDFファイル(output_page_3.pdf)へのリンク注釈です。

pdftool.6.0.page2

出力サンプルPDF(3ページ目)

前ページのPDFファイル(output_page_2.pdf)へのリンク注釈です。

pdftool.6.0.page3

索引用のPDFファイルを作成して、分割したPDFファイルへリンク注釈を設定するなども可能です。




瞬簡PDF 変換 2024
PDFをOffice文書へ高精度変換


瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識

『Antenna House PDF Tool API』(PDF Tool API)でページ単位に分割してみる(1)

『Antenna House PDF Tool API』(PDF Tool API)は、PDFファイルの情報取得やPDFファイルの加工・編集を行うライブラリです。
PDFに関するさまざまな処理機能を搭載しています。
文書情報やページ数などの情報取得、ページの挿入や削除、透かしの挿入、セキュリティ設定などのファイル加工、ページコンテンツのテキストや画像の削除、画像の最適化(ダウンサンプリング)といったページ編集処理が可能です。

今回は『Antenna House PDF Tool API』(PDF Tool API)を使用して、複数ページのPDFを、1ページ単位に分割してみたいと思います。

Javaサンプルコード

Javaサンプルコード(ExtractPage)のダウンロード(ZIP)

入力元PDFから1ページ単位で取り出し、出力先PDFを生成します。
この時、入力PDFの文書情報を、出力先PDFに設定しています。

入力サンプルPDF(総ページ数3)

pdftool.6.0

出力サンプルPDF(1ページ目)

pdftool.6.0.page1

出力サンプルPDF(2ページ目)

pdftool.6.0.page2

出力サンプルPDF(3ページ目)

pdftool.6.0.page3

入力元PDFが1000ページであれば、出力先PDFは1000ファイルになります。
分割条件を変更すれば10ページ単位や、特定の文字列をキーに、そのページで分割なども可能です。

製品に関するご質問は
sis@antenna.co.jp(SYSTEM担当)
または
oem@antenna.co.jp(OEM担当)
まで、お気軽にお問い合わせください。

評価版のお申込
評価版のお申込ページ

Webページ
https://www.antenna.co.jp/ptl/




瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識


アウトライナー
PDFを解析して しおり・目次を自動生成

「PDF CookBook 第3巻」プリント版発売しました。また、全文をWebで公開しています。

電子の紙PDFを企業向けのシステムの中で編集したり、加工したりする方法を紹介するPDFの料理本シリーズ『PDF CookBook 第3巻』ができあがりました。

PDF CookBook 表紙

本書は、紙版をアマゾンなどからプリントオンデマンドで販売、PDF版(ダウンロード)はアンテナハウスのオンラインストアから販売、HTMLはPDF Tool APIのWebページにて全文を公開しています。

『PDF CookBook 第3巻』ではPDFからテキストを抽出・検索する機能、PDFから画像の抽出・画像の最適化、矩形内のデータ削除と塗りつぶし(墨消し)、フォントの統合・埋め込み、PDFの最適化、PDFにレイヤーを追加する機能など豊富なテーマを扱います。

各機能の解説・役割や目的、見込まれる効果の紹介、PDF Tool APIによるサンプルプログラム、処理実行例を紹介しています。PDFを扱うプログラマーはもちろんですが、企画・営業担当の方でもPDFの豊富な機能や使い方についての知識やアイデアが得られるでしょう。

目次
はじめに
第1章 テキストの抽出・検索
1.1 テキスト抽出
1.1.1 ページから全テキスト抽出
1.1.2 指定矩形からテキストを抽出
1.2 テキスト検索
1.2.1 キーワードの指定による検索
1.2.2 検索オプションの指定:検索対象文字列のオプション
1.2.3 検索オプションの指定:取得順序
1.2.4 検索オプションの指定:同一行とみなす文字の重なり
第2章 画像の抽出・最適化
2.1 画像抽出
2.1.1 画像個数の取得
2.1.2 指定した画像を抽出
2.1.3 出力画像形式の指定
2.1.4 画像の大きさ、解像度を取得
2.2 画像の最適化
2.2.1 カラー画像最適化オプションの取得・指定
2.2.2 グレースケール画像最適化オプションの取得・指定
2.2.3 モノクロ画像最適化オプションの取得・指定
2.2.4 ダウンサンプリング方法の指定
2.2.5 最適化を行う画像の対象とするフィルターの指定
2.2.6 ダウンサンプリングする画素数の指定
2.2.7 ダウンサンプリング率の下限値の指定
2.2.8 ダウンサンプリング対象の画像をPPIで絞り込む
2.2.9 ダウンサンプリング後のPPI を指定する
2.3 JPEG 圧縮
2.3.1 JPEG 圧縮設定
第3章 矩形内のデータ削除
3.1 マスクの特性
3.1.1 マスクの色
3.1.2 マスクの不透明度
3.2 削除する対象
3.2.1 テキスト:矩形内の文字を削除
3.2.2 テキスト:削除時オプションの指定
3.2.3 画像:矩形内の画像データを部分削除
3.2.4 図形:矩形内にパスデータ全体が含まれる場合に削除
3.3 テキスト検索:マスク処理
3.3.1 テキスト検索とマスク処理の組み合わせ
第4章フォントリソース
4.1 フォントの統合と埋め込み
4.1.1 フォントの統合
4.1.2 フォントの埋め込み
第5章 PDF の最適化
5.1 画像の最適化
5.1.1 画像の最適化
5.2 不要なデータの削除
5.2.1 オープンアクションの削除
5.2.2 しおりの削除
5.2.3 注釈・フォームの削除
5.2.4 アーティクルの削除
5.2.5 サムネールの削除
第6章 レイヤー作成
6.1 レイヤーの作成・追加
6.1.1 レイヤーに使用するPDF 文書ページを設定
6.1.2 レイヤーの名前の指定
6.1.3 レイヤーの不透明度の指定
6.1.4 回転角度の設定
6.1.5 レイヤーのZ オーダーの指定
6.1.6 レイヤーの表示/非表示の指定
索引

紙版(プリントオンデマンド)
出版社: アンテナハウスCAS電子出版
発売日:2018年10月下旬(予定)
サイズ:B5判 横組み
ページ数:126ページ
価格(税込):1,728円
ISBN:978-4-900552-64-7
販売店:アマゾン(10月22日発売予定)

デジタル版(PDF)
販売形式:PDF版(DRMなし)
ページ数:126ページ
価格(税込み):864円
販売店:アンテナハウス・オンラインショップ(PDFのダウンロード)

HTML版
Webで全文公開中

シリーズ既刊本紹介ページへのリンク
『PDF CookBook』
『PDF CookBook 第2巻』
『PDF CookBook 第4巻』




アウトライナー
PDFを解析して しおり・目次を自動生成


瞬簡PDF 作成 2024
ドラッグ&ドロップでPDF作成
Pages: 1 2 3 4 5 Next