タグ別アーカイブ: PDFテックの知恵袋

【PDFテックの知恵袋】PDFのファイル結合は、PDFのファイル分割とは違う注意点があります。

PDFファイルの結合は、複数のPDF文書を指定した順番で1つのPDF文書として保存するプロセスです。

PDFファイルを結合する操作

PDF Tool API」でPDFファイルを結合する操作では、以下のことが行われます:

1.PDFの読み込み: まず、結合する2つのPDF文書を指定した順番で読み込みます。
2.ページの取得と追加: 1つ目のPDFからページオブジェクトのコンテナ(後述)を取得し、2つ目のPDFの指定した範囲のページを1つ目のPDFに追加します。
3.結合オプションの選択: 結合時に、注釈やフォーム、しおり、添付ファイルなどを一緒に結合するかどうかを選択できます。例えば、注釈を除外したり、しおりをコピーしたりするオプションがあります。
4.保存: 最後に、結合したPDFを新しいファイルとして保存します。

これらの操作を通じて、複数のPDF文書を1つのPDF文書として保存することができます。詳しくは次を参照してください。

「ページオブジェクトのコンテナ」とは、PDF文書内の各ページを管理するためのオブジェクトの集合体を指します。PDF文書を結合する際に、最初のPDFを読み込んで、このページオブジェクトのコンテナを取得し、他のPDFのページを追加する際に使用します。具体的には、getPages() メソッドを使用してページオブジェクトのコンテナを取得します。

注意事項

PDFファイルの結合において問題となる可能性がある点として、以下のようなことが挙げられます:
PDFバージョンの違い: 異なるバージョンのPDFを結合する場合、出力PDFのバージョンは結合対象の中で最も高いバージョンになります。これにより、互換性の問題が生じる可能性があります。
注釈やフォームの扱い: 結合する際に、注釈やフォームを含めるか除外するかの選択が必要です。これにより、結合後のPDFの内容が変わる可能性があります。
しおりや添付ファイルのコピー: 他のPDFからページを挿入する際に、しおりや添付ファイルをコピーするかどうかの選択が必要です。これにより、結合後のPDFのナビゲーションや付加情報が変わる可能性があります。
ページ番号の調整: ページを挿入することでファイル先頭から数えたページ数が変わります。このためページ番号や目次の調整が必要になることがあります。
リンクの調整: PDFファイルを跨るリンクをページ内のリンクに変更するなどの調整が必要です。

ファイルサイズ

PDFを結合するとき、結合元の複数のPDFファイルで同じフォントが使われていると、フォントリソースが重複することがあります。

重複するフォントリソースについては、フォントの統合機能を使用することで統合が可能です。結合後にフォントリソースを統合することができます。




瞬簡PDF 作成 2024
ドラッグ&ドロップでPDF作成


瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識

【PDFテックの知恵袋】PDFの分割は簡単ですが、いろいろ配慮すべきことがあります。

PDFファイルの中では、主な情報がページ単位でまとまって管理されています。そこで、指定したページ位置で2つに分割するのは簡単です。

PDF Tool APIでは、PDF文書とページ分割位置を入力してPDFファイルを2つに分割できます。具体的には次のように行います。

分割位置までをコピーして1つ目のPDFを作成し、分割位置から最後のページまでをコピーして2つ目のPDFを作成します。元のPDFの文書情報は複製され、タイトルには1/2、2/2が追記されます。

指定したページで2分割する機能を繰り返し使えば、任意の数のファイル数に分割するシステムを作ることができるでしょう。

PDF分割における調整項目

リンクの調整

PDFファイルを分割すると、同一PDFファイル内のページ間リンクだったものが、外部PDFファイルへのリンクになるかもしれません。このようなときは、リンク先をPDFファイルの内部リンクからPDFファイルの外部リンクに変更する必要があります。

PDFファイルから外部PDFファイルへのリンクを設定するには、PDF Tool APIを使用してGoToRアクションを指定します。GoToRアクションは異なるPDF内の指定された宛先(ページ、位置、および倍率)へ移動するためのアクションです。リンク注釈を挿入し、アクションとしてGoToRアクションを設定することで、外部PDFファイルへのリンクを作成できます。

しおりの調整

リンクと同じようにしおりも、しおりのジャンプ先が同一PDFファイルの別ページだったものが外部PDFファイルの特定ページへのジャンプになるかもしれません。このようが調整も必要です。

しおりには、外部PDFの指定したページを行先としてリンクと同じようなアクションを指定できます。

PDF分割時のリンク・しおり調整機能をもつツール

PDF分割時のリンク・しおり調整は、技術的に難しいものではありませんが、自前で開発するのは若干の工数がかかります。

エンドユーザ向けのツールですが、「アウトライナー」はさまざまなPDF分割方法や、PDF分割時のリンク・しおり調整機能を提供しています。




瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識


HTML on Word
WebページをWordで作る!

【PDFテックの知恵袋】PDFの墨消しとはどんなことでしょうか。墨消し範囲に跨るデータはどうなりますか?

PDFを公開する際に見せたくない場所を単に黒で塗りつぶすだけでは、データが表面上見えなくなるだけで、データそのものはPDFファイルに残っています。したがって、特定のツールや方法を使えば、塗りつぶされた部分のデータを復元できることがあります。PDFファイルからデータを完全に削除するためには、矩形内のデータ削除機能を使用して、PDFファイルからデータそのものを取り除く必要があります。

PDFの墨消しとは、PDF文書のページ上に指定した矩形領域に重なるテキスト、画像、図形などのオブジェクトをPDFファイルから削除する機能です。この削除は非表示にするのではなく、データそのものを取り除くことを指します。また、指定した矩形領域を黒で塗りつぶすことができ、これが一般的に「墨消し」と呼ばれる機能です。

墨消しの対象になるのは文字、画像(イメージ)、パス(線画)ですが、墨消しの指定範囲(矩形)の境界にまたがるときの扱いがそれぞれ異なります。次に簡単に説明します。

墨消範囲の内部と外部にまたがる文字の扱い

テキストは、指定矩形内の文字が削除されます。墨消し指定した矩形の線上の文字も削除対象です。矩形範囲内のテキスト削除のときとは異なるので注意してください。

墨消範囲の内部と外部にまたがる画像の扱い

画像の中で、墨消し指定した矩形と重なる画像部分だけを削除(部分画像削除)できます。画像の部分削除の例は次をご参照ください。

墨消範囲の内部と外部にまたがるパスの扱い

墨消しの指定範囲に完全に含まれていない線画(パスデータ)は削除されません。パスデータは、指定された矩形内に全体が含まれる場合にのみ削除されます。したがって、指定範囲の内側と外側にまたがる線画は削除されないことになります。

過去3回分

10月23日 【PDFテックの知恵袋】PDFのしおりとは何でしょうか。どうやってつくりますか。
10月24日 【PDFテックの知恵袋】 PDFのページに書かれているテキストを削除できますか。
10月25日 【PDFテックの知恵袋】PDFのページに書かれているテキストを取得(抽出)できますか?




アウトライナー
PDFを解析して しおり・目次を自動生成


瞬簡PDF 変換 2024
PDFをOffice文書へ高精度変換

【PDFテックの知恵袋】PDFのページに書かれているテキストを取得(抽出)できますか?

ページ上の矩形を指定してテキスト抽出

PDF Tool API』を使用して、指定した矩形領域からテキストを抽出することが可能です。具体的には、PtlParamExtractText.appendRect(PtlRect rectMM)を使用してテキスト抽出する矩形を追加し、PtlParamExtractText.setTextOverlapRatio(float overlapRatio)でテキストが矩形とどれくらい重なっていたら抽出対象とするかを設定します。

テキストに指定されているフォントファミリー、文字の大きさ、文字の色などの取得

PDFのテキストを取り出す際に、指定されているフォントファミリー、文字の大きさ、文字の色などの情報を同時に取得することができます。具体的には、PtlEditTextやPtlEditTextItemを使用して、PDFに含まれるテキストオブジェクトの情報を取得できます。これには、テキストの内容、フォント情報(フォント名、フォントタイプ、エンコーディング名など)、およびテキストの色(ストロークカラー、塗りつぶしカラー)が含まれます。フォント情報はPtlFontInfoクラスを通じて取得できます。

テキストの並び順序

PDFファイルの中で文字データが保存されている順番は、必ずしも画面表示の順番とは限りません。ファイルの中の文字をPDFの画面(ページ面)に表示するときは指定された座標位置に表示されます。このため画面上の見た目でつながっていても、ファイルの中では文字がつながっているとは限りません。

テキストを矩形から抽出する際、テキストの順序はPDF内での配置順にするか、座標でソートして抽出するかを選択できます(座標でソートして抽出する機能はV7.0より追加されました)。PDF内での配置順のまま抽出すると見た目とは異なる順序で抽出される場合があります。

抽出できないテキスト

画像として埋め込まれた文字はテキストとして取得できません。また、特殊なフォントやエンコードが使用されている場合、テキストとして取得できないことがあります。

過去3回分

10月21日 【PDFテックの知恵袋】 PDFファイルの指定したページ上の指定した位置に文字を追記できますか?
10月23日 【PDFテックの知恵袋】PDFのしおりとは何でしょうか。どうやってつくりますか。
10月24日 【PDFテックの知恵袋】 PDFのページに書かれているテキストを削除できますか。




瞬簡PDF 変換 2024
PDFをOffice文書へ高精度変換


HTML on Word
WebページをWordで作る!

【PDFテックの知恵袋】PDFのページに書かれているテキストを削除できますか。

PDFからテキストを削除するために、削除対象テキストを指定する必要があります。『PDF Tool API』では、文字列を指定して検索してヒットしたテキストを削除する方法と、ページの上に矩形を指定して矩形内のテキストを削除する方法があります。

特定のテキストを検索し削除

ページ番号とキーワードを入力して検索し、ヒットしたキーワードのテキストをマスク処理により削除することができます。マスク処理とは、PDF文書や画像において特定の部分を隠したり、削除したりするための技術です。

指定した位置の文字を削除

PDFのページ上で指定した位置の文字を削除できます。『PDF Tool API』では、指定したページで矩形範囲により削除するテキストを指定します。

削除対象とするエレメントを設定するために、PtlParamSetMask.setRemoveElement(int remove)メソッドを使用し、テキストを削除対象とするにはPtlParamSetMask.REMOVE_TEXTを指定します。矩形との重なり度合も指定できます。詳しくは以下のURLを参照してください:

削除する矩形範囲を指定した際、その範囲にまたがる文字の扱いについては、テキストが矩形とどれくらい重なっていたら削除対象とするかを数値で指定することができます。この数値は0.0より大きく1.0以下で設定し、指定しない場合はデフォルトで0.3が適用されます。つまり、指定した重なりの割合以上であれば削除対象となります。

過去3回分

10月18日 【PDFテックの知恵袋】 PDFのファイルサイズを小さくする方法としてどんなことがありますか。
10月21日 【PDFテックの知恵袋】 PDFファイルの指定したページ上の指定した位置に文字を追記できますか?
10月23日 【PDFテックの知恵袋】PDFのしおりとは何でしょうか。どうやってつくりますか。




瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識


アウトライナー
PDFを解析して しおり・目次を自動生成

【PDFテックの知恵袋】PDFのしおりとは何でしょうか。どうやってつくりますか。

PDFのしおり(ブックマーク、アウトラインともいいます)は、PDF文書のナビゲーションをするためのツリー構造です。PDFリーダーではしおりのための専用ウィンドウに、しおりツリーを表示し、各項目をクリックするとPDF文書内部の指定位置または外部の指定位置にジャンプします。しおりの項目には、表示するタイトル文字列やその表示色・スタイルなどを設定できます。また、クリックしたときのアクションを設定できます。

  • 詳しくは右のページを参照してください:しおり

しおりはどうやって作りますか?

PDF文書にしおりを作成するには、しおりの階層構造を設定し、各しおりのタイトルやリンク先、表示スタイルを指定します。具体的には、最上位階層に見出しを設定し、その子供として他の見出しや外部リンクを追加します。しおりのタイトルには色を設定し、表示倍率やアウトラインフラグを指定して太字やイタリックにすることも可能です。PDF Tool APIを使用して、setTitle()でタイトルを設定し、setPageNumber()で宛先ページを指定するなどの機能を利用します。

PDF結合時に、結合元ファイル名をしおりとして作成できますか?

PDF結合時に結合元ファイル名をしおりとして作成するには、結合元のファイル名を取得して、ファイル名をしおりのタイトルとします。また、リンク先を結合先で適切な位置に設定する必要があります。

しおりの追加に関する情報は、しおりの情報取得・作成・削除に関する内容で説明されています。しおりのタイトルには任意の文字列を設定できるため、結合元ファイル名をしおりのタイトルとして設定することができます。

アンテナハウスの『アウトライナー』ではこの機能を実装しています。

PDFのしおりを作成する上の注意事項

PDFのしおりを作成する際の注意事項として、以下の点が挙げられます:

  1. しおりの階層構造: しおりはツリー構造であり、階層を意識して設定する必要があります。最上位階層とその子供の階層を明確にすることが重要です。
  2. しおりのタイトルと色: 各しおりのタイトルには、見出しの文字列やURLを使用し、色を設定することができます。視覚的にわかりやすくするために、適切な色を選ぶことが推奨されます。
  3. 表示倍率の設定: しおりをクリックした際の表示倍率を設定することができます。例えば、PtlDestFitを用いてページ全体がウィンドウ内に収まるようにするなど、ユーザーの利便性を考慮した設定が必要です。
  4. アクションの設定: しおりをクリックした際のアクションを設定することができます。外部リンクを設定する場合は、リンク動作を確認し、正しく設定されているかを確認することが重要です。
  5. アウトラインフラグ: しおりの表記を太字やイタリックにするために、アウトラインフラグを設定することができます。視覚的な強調が必要な場合に使用します。

これらの点を考慮しながら、しおりを作成することで、PDF文書のナビゲーションがより効果的になります。

過去3回分

10月11日 【PDFテックの知恵袋】PDFへの画像追加と印影追加は何が違いますか。印影追加にはどんな方法がありますか。
10月18日 【PDFテックの知恵袋】 PDFのファイルサイズを小さくする方法としてどんなことがありますか。
10月21日 【PDFテックの知恵袋】 PDFファイルの指定したページ上の指定した位置に文字を追記できますか?




瞬簡PDF 作成 2024
ドラッグ&ドロップでPDF作成


瞬簡PDF 編集 2024
かんたん操作でPDFを自由自在に編集

【PDFテックの知恵袋】PDFファイルの指定したページ上の指定した位置に文字を追記できますか?

はい、PDFファイルの指定したページ上の指定した位置に文字を追記することができます。『PDF Tool API』を使用すれば、ページの位置を指定し、文字列を配置矩形に基づいて配置することが可能です。例えば、writeString関数を使用して、指定した位置に文字列を出力することができます。

PDFにテキストを記入する時、文字の大きさとフォントを指定できますか。

はい、PDFにテキストを記入する際には、文字の大きさとフォントを指定することができます。フォントファミリー名やフォントサイズ(ポイント単位)、フォントの埋め込みの有無、イタリックの指定、フォントウェイトの指定などが可能です。これらの設定は、setFont()setSize()などの機能を使用して行います。

  • フォントの設定に関する詳細は右のWebページをご参照ください: フォントの設定

PDFにテキストを記入する時、そのテキストに指定したフォントをフォント埋め込みできますか。

はい、PDFにテキストを記入する際に、指定したフォントをフォント埋め込みすることが可能です。フォントの埋め込みは、透かし文字列や通常のテキストに対して設定できます。具体的には、PDF Tool APIのsetEmbed()機能を使用して、フォントを埋め込むかどうかを設定します。

PDFファイルに文字を追記するときの注意事項がありますか。

PDFファイルに文字を追記する際には、以下の点に注意する必要があります。

  1. 配置矩形の設定: 文字列を配置する基準位置を配置矩形として指定しますが、文字列が配置矩形の幅を超える場合、描画された文字列は配置矩形をはみ出します。配置矩形の幅で縮小したり、改行したりといった調整は行われないため、文字列の長さに注意が必要です。
  2. 配置の基準位置: 文字列の配置基準となる位置を正確に指定することが重要です。配置の基準位置は、左上、中央上、右上、中央左、中央、中央右、左下、中央下、右下などから選択できます。

これらの点を考慮して、PDFに文字を追記する際の配置や表示を適切に管理することが求められます。

過去3回分

10月10日 【PDFテックの知恵袋】PDFの透かしとはどのようなものですか。透かしの活用法にはどんなことがありますか。
10月11日 【PDFテックの知恵袋】PDFへの画像追加と印影追加は何が違いますか。印影追加にはどんな方法がありますか。
10月18日 【PDFテックの知恵袋】 PDFのファイルサイズを小さくする方法としてどんなことがありますか。




瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識


アウトライナー
PDFを解析して しおり・目次を自動生成

【PDFテックの知恵袋】 PDFのファイルサイズを小さくする方法としてどんなことがありますか。

PDFのファイルサイズを小さくする方法として、以下の方法があります。

  1. 画像の最適化: 画像のダウンサンプリングや圧縮形式の変更を行うことで、PDFのファイルサイズを小さくすることができます。具体的には、カラー画像、グレースケール画像、モノクロ画像ごとに最適化を行い、圧縮形式や圧縮の具合を調整します。
  2. 不要な機能の削除: PDFから不要なJavaScriptアクションなどの機能を削除することで、ファイルサイズを削減できます。

これらの方法を組み合わせることで、PDFのファイルサイズを効果的に小さくすることが可能です。

画像の最適化の方法

画像の最適化の方法能については、以下の情報が参考になります。

ダウンサンプリングは、画像の解像度を下げることでファイルサイズを小さくするための手法です。PDF Tool APIでは、ダウンサンプリングの条件として以下のような設定が可能です。

  • ダウンサンプリングを行うPPI値の設定(例: 150 PPI以上の場合にダウンサンプリングを実施)
  • ダウンサンプリング後のPPI値の設定(例: 75 PPI)
  • ダウンサンプリング方法の選択(例: バイキュービック法)
  • ダウンサンプリング率の下限値の設定(例: 0.65)

これらの設定を行うことで、画像の最適化を行い、PDFのファイルサイズを効率的に管理することができます。

詳しい情報は以下のURLから確認できます。

必須ではない機能

PDFファイルの中の必須ではない機能としては、オープンアクション、しおり、注釈・フォーム、アーティクル、サムネールなどがあります。これらはPDF Tool APIを使用して最適化の際に削除することが可能です。また、JavaScriptアクションもオプションとして削除することができます。これにより、PDFの安全性を高めることができます。

過去3回分

10月7日 【PDFテックの知恵袋】PDFフォームとはどのような機能ですか?
10月10日 【PDFテックの知恵袋】PDFの透かしとはどのようなものですか。透かしの活用法にはどんなことがありますか。
10月11日 【PDFテックの知恵袋】PDFへの画像追加と印影追加は何が違いますか。印影追加にはどんな方法がありますか。




HTML on Word
WebページをWordで作る!


アウトライナー
PDFを解析して しおり・目次を自動生成

【PDFテックの知恵袋】PDFへの画像追加と印影追加は何が違いますか。印影追加にはどんな方法がありますか。

画像の挿入と印影の挿入の違いについて説明します。

画像の挿入は、PDF文書のページにビットマップ画像を追加することを指します。画像の挿入では、配置するページとそのページ内での画像の配置基準を指定し、画像の大きさが配置矩形より大きい場合は縮小し、小さい場合はそのまま配置します。また、画像の透明度やマスク処理を指定することも可能です。

印影の挿入は、印鑑の画像をPDF文書に捺印することを指します。印影画像は、文字の上に重ねて配置する際に白地から文字が透けて見えるように、地の部分が透明になっていることが重要です。

違いは、相違点は画像の挿入は一般的なビットマップ画像の追加に関するものですが、印影の挿入が特に印鑑画像に特化している点です。

印影追加の方法

印影画像の追加の際は、印鑑画像を所定の位置に配置し、必要に応じて画像の透明度を調整することができます。

画像のマスク処理

画像のマスク処理とは、画像に対して特定の部分を隠したり、透明化したりするための技術です。PDFではカラーキーマスク、明示マスク、ソフトマスク、ステンシルマスクといったマスク処理を使えます。

印影の挿入ではステンシルマスク(MASK_STENCIL)を使うと便利です。ステンシルマスクはモノクロ(1ビット)のビットマップ画像をマスク画像として使います。黒と白の領域を不透明と透明のように扱い、地の部分をマスク画像で切り抜いた効果をもたらします。不透明部分の色を指定できます。PDF1.3以前では透明が使えないため透明の代わりにステンシルマスクで表現できます。

過去3回分

10月4日 【PDFテックの知恵袋】PDFのフォント埋め込みとはどんなことですか?
10月7日 【PDFテックの知恵袋】PDFフォームとはどのような機能ですか?
10月10日 【PDFテックの知恵袋】PDFの透かしとはどのようなものですか。透かしの活用法にはどんなことがありますか。




瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識


アウトライナー
PDFを解析して しおり・目次を自動生成

【PDFテックの知恵袋】PDFの透かしとはどのようなものですか。透かしの活用法にはどんなことがありますか。

PDFの透かしは、PDF文書のページ上に独立して表示される文字や画像のことを指します。透かしは、テキスト、画像、PDF文書、色の4種類があり、ページ番号の範囲を指定して繰り返し配置したり、Zオーダー(前景か背景か)を指定したりすることができます。また、透かしの不透明度や表示・印刷の有無を設定することも可能です。

透かしの活用法

PDFの透かしを使用するメリットとして、以下の点が挙げられます。

  1. ブランドの一貫性: 会社のロゴやレターヘッドを透かしとして使用することで、文書全体にブランドの一貫性を持たせることができます(参考情報)。
  2. セキュリティと著作権保護: 透かしを使用することで、文書のコピーや不正使用を防ぐための視覚的な抑止力を提供します。
  3. カスタマイズ性: 透かしの倍率や配置、透明度などを細かく設定できるため、文書のデザインに合わせたカスタマイズが可能です(参考情報)。
  4. 編集可能性: Acrobat互換の透かしを使用することで、Acrobat上で透かしを編集・加工することが可能になります(参考情報)。
  5. 印刷設定: 透かしを印刷するかどうかを指定できるため、印刷時にのみ表示される透かしを作成することも可能です(参考情報)。

これらの機能により、PDFの透かしは文書の保護やブランド強化に役立ちます。

Acrobat互換の透かし

透かしはPDFの標準仕様(ISO 32000)で標準化されている機能ではないので実現方法は、ツールによって異なります。

PDF Tool APIでは、ISO 32000-1のオプショナルコンテント機能を利用して透かしを実装しています。また、Acrobat互換の透かしを設定することもできます。

Acrobat互換の透かしとは、Acrobat上で透かしとして認識され、加工・編集が可能な透かしのことです。具体的には、テキスト透かしの書式設定において、下線を引く機能や複数行のテキストの行揃えオプションを指定することができます。これらの機能はAcrobat互換透かしでのみ利用可能です。また、Acrobat互換の透かしを設定することで、出力されたPDFに含まれる透かしはAcrobat上で編集可能になります。ただし、Acrobat非互換のプロパティを設定するとエラーが発生するため注意が必要です。

詳しくは以下のURLをご参照ください:

過去3回分

10月3日 【PDFテックの知恵袋】PDFの注釈機能とはどんな機能ですか。注釈とPDFの本文テキストや画像との違いはどんなことでしょうか
10月4日 【PDFテックの知恵袋】PDFのフォント埋め込みとはどんなことですか?
10月7日 【PDFテックの知恵袋】PDFフォームとはどのような機能ですか?




瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識


瞬簡PDF 変換 2024
PDFをOffice文書へ高精度変換
Pages: 1 2 Next