カテゴリー別アーカイブ: PDF のあれこれ

無料のPDF編集ツールはどの程度使えるか―Smallpdfは無料で使える？

Copilotに聞いてみました。

質問
無料のPDF編集ツールはどんなものがありますか

回答
もちろんです！PDFを編集するための無料のツールがいくつかあります。以下はいくつかのオプションです。

Smallpdf:
オンラインで直接使える無料のPDFエディターです。
テキストの編集や画像の追加、図形やハイライトの挿入などが簡単に行えます
＜以下、略＞

Copilotに限らず、無料のPDF編集ツ―ルとしてSmallpdfがよく挙げられます。Smallpdfは結構人気があるようです。そこでSmallpdfってどんなものなのかちょっと調べてみました。

まず、Webページです。Smallpdfのトップページはこちらです：
https://smallpdf.com/jp

画面右上で「ログイン」すると次のような画面になります。

メニューにリストされている機能を一覧表に整理すると次のようになります。

分類	機能リスト	概要説明
変換＆圧縮	PDF 圧縮	PDFのサイズを縮小
	PDFコンバーター	Word、Excel、ppt、および画像ファイルがPDFに変換されます。PDFファイルは選択されたファイルタイプに変換されます。
	PDFスキャナー	PDFをモバイルでスキャン
整理	PDF 結合	PDFドキュメントをマージ
	PDF 分割	ページずつ分割したり、特定のページを切り取って新しいPDFファイルを作成
	PDFを回転	回転するページを選んだり、すべてのページを一度に回転
	PDFページを削除	PDFからページを削除
	PDFページの抽出	1つのPDFとしてページを抽出できます。また、選んだページごとに個別のPDFを作成することも
表示＆編集	PDF編集	テキストや画像、ハイライト、描画の追加やドキュメントの整理
	PDF注釈	注釈が追加されたPDFを透かしなしでエクスポートし、さまざまなファイル形式に変換したり、圧縮
	PDFリーダー	自由に解析、編集、共有、印刷
	ページ番号を付ける	各ページのヘッダーまたはフッターに自由にページ番号を付ける
	AI PDF要約	50MBのファイルサイズと50,000ワードの文字数を上限に、PDFドキュメントをお好きな数だけ要約
PDFから変換	PDF Word 変換	PDFをワードファイルに変換
	PDF Excel 変換	PDFファイルをExcelスプレッドシートにすばやく変換。OCRも可能
	PDF PPT 変換	PDFをPPTファイルに変換
	PDF JPEG 変換	「全てのページを変換」または「画像を1枚ずつ抽出」
PDFに変換	Word PDF 変換	DOCとDOCXを数秒以内にPDFに保存
	Excel PDF 変換	xls/xlsxファイルをPDFに自動変換
	PPT PDF 変換	PPT も新しい PPTX フォーマットもどちらも変換
	JPEG PDF 変換	文字のサイズ、ページの向き、ページ余白を自由に調整
	PDF OCR	OCRなら、選択可能なテキストを含む検索可能なPDFを作成
署名＆セキュリティ	EサインPDF	署名と署名者を検証するためのLTV（長期検証）タイムスタンプが付与
	PDF ロック解除	PDFからパスワードを解除
	PDFを保護	PDFにパスワードを追加
	PDFをフラット化する	内容がドキュメントに恒久的に埋め込まれる

ざっくりみると、PDF編集ツールとしてはかなり機能が充実しているように見えます。もう少し詳細なところは後ほどチェックすることにして、「価格」を見てみましょう。

価格には次の4つのメニューがあります。
①無料
②プロ（月額1,013円）
③チーム（月額825円）
④ビジネス（カスタム価格）

プロとチームは、それぞれ、7日間のトライアル期間があります。トライアル期間を開始するにあたっては、クレジットカード情報の登録が必要で、7日間の試用が終わると課金されることになります。

有償ツールのトライアル期間は無料ツールには含めないとすると、「①無料」でどこまで使えるかがチェックポイントとなります。実際に使ってみると、多くのメニューは確かに無料で使えますが、しかし、重要な制限があります。

１．無料で使用するとき「ダウンロード」の制限があります。今回試した範囲では二つのPDFファイルを作成してダウンロードできました。しかし、三つ目をダウンロードしようとしたら、もう1日の制限容量を超えてしまったということで、次の画面のメッセージがでてダウンロードできません。１日にたった2ファイルしかダウンロードできないのでは、少なくとも仕事には使えないでしょう。

２．メニューでは一通りの機能があるように見えます。しかし「PDF編集」の中の「テキストや画像、ハイライト、描画の追加」をみると、ほぼ注釈の編集機能です。PDF本文編集では、本文への「テキスト」の追加機能があります。これを使おうとすると、次のダイアログが表示されます。

どうやら、これはSmallpdf proの機能のため「無料」では使えないようです。

Smallpdfツールは機能がかなり充実していて魅力的を感じる点もあるサービスです。

しかし、上記の１、２の制約を考えると「無料のPDF編集ツール」かもしれませんが、Smallpdfを「無料で実用に使える」とは言えないでしょう。無料はPR効果を狙った宣伝用語に過ぎないといえそうです。

弊社の有償ツールとの比較

結局、PDF編集を実用的に使いこなそうとするならば、有料のSmallpdf Proを契約するしかなさそうです。Smallpdf Proは、弊社製品で比較するならば『瞬簡PDF統合版』が機能的には一番近くなります。

契約体系が全く異なっているので価格は比較しにくいですが、次の表のとおり、１年と少しを超えて使用する予定があるなら『瞬簡PDF統合版』の方がお安くなります。

無料という宣伝文句に踊らされないようにしっかり比較してみましょう。

	Smallpdf pro	瞬簡PDF統合版シングルライセンス
契約方式	サブスクリプション	永続ライセンス
月間利用料	非課税（？）1,013円	パッケージ版税込15,950円ダウンロード版税込14,190円価格は値引きなし標準価格値引きが適用されとさらにお安くなります。
1年間使用	非課税（？）12,150円
2年間使用	非課税（？）24,300円
3年間使用	非課税（？）36,450円

PDF資料室へ

投票をお願いいたします

Google Chrome開発者版（86）でタグ付きPDFを出力[8/4修正]

[8/4追記]社内で「Chrome出力ではなくAcrobat Readerの対応外のタグ使用によって表示が壊れている可能性がある」と指摘を受けました。記事内での表現を修正します。

当初の記事タイトルは「タグ付きPDFがGoogle Chromeのデフォルトに？」だったのですが、現状としては「今後Google Chromeでタグ付きPDF出力が可能になるかもしれない」あたりのようです。

今回使用した環境は次になります。

Windows 10 Home 1909
Google Chrome バージョン: 86.0.4221.0（Official Build）canary （64 ビット）
Acrobat Reader DC – Japansese (20.009.20074)
検証に使用したページ^*： https://www.w3.org/TR/xsl11/

2020年8月リリースのGoogle Chrome 85から、タグ付きPDFの出力がサポートされます[1]。関連する情報発信自体は以前からあったようですが、実際にリリースされるこのタイミングで俄かに活気づいているようです。活気づいてますよね？

早速Google Chromeをサイトからダウンロードしてみましたが、バージョンを確認すると2020年8月3日時点では84のようです。Google ChromeにはCanaryバージョンがあるのでこちらをダウンロード。試験運用版ですので、同様に検証される方はくれぐれも自己責任でお願いします。（84でもExperimentalの設定として「Export Tagged PDF」を有効化できます。）

バージョンを確認。86……86ですね。85ではありませんが、検証には問題ないでしょう^†。

^† この後Chrome 84でのtagged PDF出力も確認しましたが、同様の結果になりました。

タグ付きPDFとは

ざっくりとまとめると「タグ付きPDFは、内部に文書構造を指定するタグを付与したPDFのこと」になります。
通常PDFは印刷物のデジタル表現、つまり視覚的な表現として文書構造が見られればよいわけですが、
PDF内部のデータを別の目的で使うときにこの情報だけでは不足することがあります。
別の目的としては、データの読み上げ、PDFから他形式への再変換などがあります。

また、PDFをHTMLのようにリフローで表示したいときにも、タグを用いることで文書の表示順序などを壊さないようにできます。
「HTMLのように」と書きましたが、このタグ付きPDFで設定できるタグの多くはHTMLでのタグと類似したものになります。

概要は[2][3]、詳細は[4][5]をご覧ください。

新ビューアは今のところリフロー表示に対応していないらしい

Canaryだと、PDF出力オプションの他に「PDF Viewer Update」オプションがあるんですね。

chrome://flags/#pdf-viewer-update

これを有効化すると、84ではExperimentalのオプションである「PDF Two-up View」もついでに使えるようになります。

ウインドウ画面と表示をフィットさせる場合に上下と左右どちらを優先するか、回転表示、PDF注釈の表示のオンオフ、アウトライン表示など、色々改善がされていることがわかります。とはいえ、全体的なPDFの表示機能についてはまだまだ頑張ってほしいところです。

さて、タグ付きPDF対応と聞いて真っ先に期待してしまうであろうリフロー表示ですが、とりあえず86の新ビューアではできないようです。
「タグ付きPDFの出力」と「PDFのリフロー表示」は重なる部分もあるものの別の話なので、そういうこともありますね。
今回の新バージョンについて、ChromiumのブログにChrome Accessibilityのリーダーからコメントがあります。improving Chrome’s built-in PDF reader to better consume tagged PDFsとあるので、それなりに可能性はあるのではないでしょうか。
> While this is an important milestone, we’re not done. Future work includes both improving the quality of generated tagged PDFs, and also improving Chrome’s built-in PDF reader to better consume tagged PDFs.

タグ付きPDFをChromeで出力する

本題のタグ付きPDF出力です。Experimentalな設定で次を指定するとタグ付きPDFが出力できるようになるとあります。

chrome://flags/#export-tagged-pdf

では、PDFを出力してみます。^*のページを「PDFで保存」します。さて、本来はこれをAcrobat Readerで開いてみて「おおー」となる予定だったのですが、「表示」「折り返し」を有効にしたAcrobat Readerでのリフロー表示がうまくいってないようです。

W3Cのページはあまり変なマークアップのHTMLはないはずです。~~タグ付きPDFは検証した日時でのGoogle ChromeとしてはExperimentalな機能なので、こちらが原因でしょうか。~~タグ付きPDFとリフロー表示についてはAcrobat Readerの対応状況も関連するので、Chromeの出力が原因ではないかもしれないとの指摘をいただきました。Google Chromeには自分の出力の正しさを証明するためにもPDFリフロー表示に対応してほしいですね。
PDFの内部を確認したい方は、アンテナハウスのデスクトップ製品『
瞬簡PDF 編集 9』[6]付属の『タグ編集ツール PDFタグエディターVer.2』を使うとよいかもしれません。

他に数件確認してみましたが、ページが上のように壊れることはないものの、「いきなり何もかも上手く出力できる」とはいかないようです。Experimentalな機能なので詳細な検証をすることを避けました。

ちなみに、Chromeでのタグ付きでないPDF出力をAcrobat Readerの折り返し表示したときは、とりあえずは表示されています。

ちなみに、同じWebサイトをAntenna House Formatter V7.0 MR3でタグ付きPDFを出力した場合、折り返し表示でも問題はないようです（フォントサイズや余白、分割アルゴリズムの違いなどがあるので同じ条件にはなっていません。）。

ChromeでのHTMLとタグ付きPDFの補足資料

Chromiumのタグ付きPDF機能開発におけるデザイン資料[7]によればこれはマークアップを元にタグを付与するものなので（AIが何もかもやってくれるような話ではない）、求められるタグを出力できるかはページ製作者次第です。Chromeの開発過程で実際にはどうなったかは確認していませんが（資料中のメーリスやバグトラッカーを確認していけばよさそうです）、DOMツリーと描画用ツリー、そしてARIA属性などを基にした「Accessibility tree」を利用するデザインのようです。

The accessibility tree computed in Blink is another good possibility. The accessibility tree is derived from the DOM and the Layout Tree and also takes accessibility attributes such as ARIA attributes into account.
Chromium Tagged PDF Export Design Doc

We think the accessibility tree is the best fit and that’s the design proposed here.
Chromium Tagged PDF Export Design Doc

つまり出力が完璧だったとして、現在のところ多くのWebページについて実用的かと言われれば疑問の残るところ。残念ながら、ページによってはむしろ不要なノイズだらけになってしまうでしょう。[7]に次のようにありますが、こういった機能を機にアクセシブルなWebページを作ろうという気運が再燃したりすれば幸いです。

正常に出力されるページもあるかもしれませんが、現在Experimentalとある機能ですので、今回はここまでとします。

タグ付きPDFにご興味を持たれた方は、アンテナハウスのPDF製品を是非チェックしてみてください。

if you visit a web page that’s compliant with WCAG accessibility guidelines, then export it as PDF, then open that PDF in Chrome, the PDF in Chrome should have the same level of accessibility, modulo the limitations of a PDF file.Chromium Tagged PDF Export Design Doc

投票をお願いいたします

PDFの色指定（5）CIEベースカラースペース

PDFにおけるCIEベースカラースペースは初回に紹介したように次の4つです。

CalGray
CalRGB
Lab
ICCBased

デバイスカラーベースと異なり、出力デバイスに依らず色を指定できます。出力時の処理では内部でXYZの3値による表現に変換され、このXYZがデバイスカラースペースに変換されます。そこからはデバイスカラースペースと同様に処理されます。

CalGrayはグレースペースの要素Aを用います。Aは0.0~1.0の値を取ります。値AをMatrix Aを使用しLMNの3値にデコードします。このLMNをそのままXYZとして使用します。
このMatrix Aを構成する値が、CalGrayに辞書型で格納される、CIEXYZに基づく白の基準値WhitePointと、黒の基準値BlackPointの3つの数値からなる配列と、輝度補正に使うGammaです。WhitePoint以外はオプションで、指定しなければ既定値を使用します。白と黒の基準値は、それぞれdiffuse white point、diffuse black pointと呼ばれるものです。

CalRGBでは入力値が増えます。CalRGBにに格納する辞書型は、GammaがRGBに対応する3値の配列になる他、Matrixというキーで3×3の行列が格納でき、XYZへ変換するときに補正値として用います。

PDFにおけるCIEベースカラースペースでのLabは正しくはCIE LABの方です。辞書型WhitePoint、BlackPointと、Rangeというa*、b*をそれぞれの最大値、最小値で指定する4つの数値の配列を格納しています。

最後にICCBasedカラースペースについてです。ICCカラープロファイルをストリーム型として格納できます。
追加として、サポートしていないデータがあった場合などに代替される設定名の配列Alternateや、ICCプロファイルで記述されているCoulor Componentの数Nを辞書型で格納します。PDF1.7ではICC. 1:2004-10に対応しています。

デバイス依存の色指定を、comformingなPDF writerは、機械的にCIEベースカラースペースに変換するよう要求できるとあります。

ISO 32000-1:2008にはこれらの詳細が数式・図表付きで記述されています。

参考

ISO 32000に準拠するPDFってどんなもの？

PDFの色指定について: デバイスカラースペース

PDFの色指定について(2): 色とは何か

PDFの色指定（3）CIE1931 CIELuv CIELAB: CIEカラースペース

PDFの色指定（4）: ICCプロファイル

投票をお願いいたします

PDFの色指定（4） ICCプロファイル

前回、CIE1931、CIELAB、CIELUVについて触れました。
これらを活用し、様々なデバイスで色について統一的にマネジメントするための仕組みがICCプロファイルです。

International Color Consortium（ICC）[1]は、コンピュータやデジタルカメラ、スキャナ、プリンタなどのデバイス上で統一して色の管理を行うための標準化団体です。ベンダー8社を中心に1993年に設立されました。

ICCプロファイルは基準となるカラースペースの定義と、それに基づく設定の記述によって構成されています。基準となるカラースペースはプロファイル接続空間（PCS）と呼ばれます。これは、CIEXYZやCIELABによるカラースペースに制限を加え、プロファイルに使用しやすいようにしたものです。PCSという共通のカラースペースがあることで、あるデバイスでの色の記述を、そのデバイスのプロファイルを使いPCSの色表現に変換し、それを別のデバイスプロファイルを使って別のデバイス上での色の記述に変換できます。またICCプロファイルには、色の記述をPCSでの色表現に変換するための共通のインターフェースという役割があります。
このインターフェースは、先に挙げたPCSとPCSに色の記述を変換する設定の書式を厳密に定めたもので、構造としては、ヘッダ部、タグのテーブル、タグに紐付いたデータで構成されます。変換アルゴリズムなどの実装については定めていません。

PCSからデバイスの色に変換する際に、そのままではデバイスで対応できない色が含まれる場合があります。そのときに対応していない色をどの色にマッピングするかを定める「レンダリングインテント」と呼ばれるものをICCプロファイルに用意できます。

ICCプロファイルは、デバイスによって幾つかの種類に分けられます。主に次の3つです。

スキャナ、デジタルカメラなどのための入力プロファイル
ディスプレイなどでの表示のためのディスプレイプロファイル
プリンタなどのための出力プロファイル

他の種類もあります。

画像形式での流通のためのカラースペースコンバージョンプロファイル
特定の色のための命名色プロファイル
追加の補正情報を埋め込むためのアブストラクトプロファイル

さらに、プロファイルを組み合わせて1つにした、デバイスリンクプロファイルがあります。

相互に色を変換するための共通の書式であるICCプロファイルについて概要を説明しました。
次回はようやく、PDFのCIEベースカラースペースについての回になる予定です。

[1] http://www.color.org/abouticc.xalter

PDFの色指定について: PDFの色指定の概要・デバイスカラースペース

PDFの色指定について(2): 色とは何か

PDFの色指定（3）CIE1931 CIELuv CIELAB: CIEカラースペース

PDEの色指定（5）CIEベースカラースペース: PDFのCIEベースカラースペース格納形式と使用のされ方の概略

投票をお願いいたします

暗号化されていてもPDFを開くときはご用心

暗号化されているPDFが送られてきてそのパスワードを知っていたら、作成者を信用して PDFを開いた後についつい不用心にPDFViewerの警告を無視していろいろと危ない操作をしてしまうかもしれません。しかし、2019年に、PDFのパスワードを知らないでもパスワードを変えずにPDFを色々と改変できてしまう脆弱性が発見されました(https://pdf-insecurity.org/index.html)。

まだ脆弱性に対応していないPDFViewerもあるかもしれないので、外部からもらったファイルには細心の注意を払いましょう。

投票をお願いいたします

『Antenna House PDF Tool API』（PDF Tool API）でページ単位に分割してみる(2)

『Antenna House PDF Tool API』（PDF Tool API）は、PDFファイルの情報取得やPDFファイルの加工・編集を行うライブラリです。
PDFに関するさまざまな処理機能を搭載しています。
文書情報やページ数などの情報取得、ページの挿入や削除、透かしの挿入、セキュリティ設定などのファイル加工、ページコンテンツのテキストや画像の削除、画像の最適化（ダウンサンプリング）といったページ編集処理が可能です。

今回は『Antenna House PDF Tool API』（PDF Tool API）を使用して、複数ページのPDFを、１ページ単位に分割しながら、リンク注釈を設定します。
設定されたリンク注釈をクリックすると、前後のページのPDFを呼び出します。

Javaサンプルコード

Javaサンプルコード（ExtractPageAndLink）のダウンロード(ZIP)

入力元PDFから１ページ単位で取り出し、出力先PDFを生成します。
この時、入力PDFの文書情報を、出力先PDFに設定しています。
更に、前後ページのPDFファイルへリンク注釈を設定しています。

入力サンプルPDF(総ページ数3)

出力サンプルPDF(1ページ目)

次ページのPDFファイル(output_page_2.pdf)へのリンク注釈です。

出力サンプルPDF(2ページ目)

前ページのPDFファイル(output_page_1.pdf)へのリンク注釈です。

次ページのPDFファイル(output_page_3.pdf)へのリンク注釈です。

出力サンプルPDF(3ページ目)

前ページのPDFファイル(output_page_2.pdf)へのリンク注釈です。

索引用のPDFファイルを作成して、分割したPDFファイルへリンク注釈を設定するなども可能です。

投票をお願いいたします

『Antenna House PDF Tool API』（PDF Tool API）でページ単位に分割してみる(1)

今回は『Antenna House PDF Tool API』（PDF Tool API）を使用して、複数ページのPDFを、１ページ単位に分割してみたいと思います。

Javaサンプルコード

Javaサンプルコード（ExtractPage）のダウンロード(ZIP)

入力元PDFから１ページ単位で取り出し、出力先PDFを生成します。
この時、入力PDFの文書情報を、出力先PDFに設定しています。

入力サンプルPDF(総ページ数3)

出力サンプルPDF(1ページ目)

出力サンプルPDF(2ページ目)

出力サンプルPDF(3ページ目)

入力元PDFが1000ページであれば、出力先PDFは1000ファイルになります。
分割条件を変更すれば10ページ単位や、特定の文字列をキーに、そのページで分割なども可能です。

製品に関するご質問は
sis@antenna.co.jp（SYSTEM担当）
または
oem@antenna.co.jp（OEM担当）
まで、お気軽にお問い合わせください。

評価版のお申込
評価版のお申込ページ

Webページ
https://www.antenna.co.jp/ptl/

投票をお願いいたします

「PDF CookBook 第3巻」プリント版発売しました。また、全文をWebで公開しています。

電子の紙PDFを企業向けのシステムの中で編集したり、加工したりする方法を紹介するPDFの料理本シリーズ『PDF CookBook 第3巻』ができあがりました。

PDF CookBook 表紙

本書は、紙版をアマゾンなどからプリントオンデマンドで販売、PDF版（ダウンロード）はアンテナハウスのオンラインストアから販売、HTMLはPDF Tool APIのWebページにて全文を公開しています。

『PDF CookBook 第3巻』ではPDFからテキストを抽出・検索する機能、PDFから画像の抽出・画像の最適化、矩形内のデータ削除と塗りつぶし（墨消し）、フォントの統合・埋め込み、PDFの最適化、PDFにレイヤーを追加する機能など豊富なテーマを扱います。

各機能の解説・役割や目的、見込まれる効果の紹介、PDF Tool APIによるサンプルプログラム、処理実行例を紹介しています。PDFを扱うプログラマーはもちろんですが、企画・営業担当の方でもPDFの豊富な機能や使い方についての知識やアイデアが得られるでしょう。

目次
はじめに
第1章テキストの抽出・検索
1.1 テキスト抽出
1.1.1 ページから全テキスト抽出
1.1.2 指定矩形からテキストを抽出
1.2 テキスト検索
1.2.1 キーワードの指定による検索
1.2.2 検索オプションの指定：検索対象文字列のオプション
1.2.3 検索オプションの指定：取得順序
1.2.4 検索オプションの指定：同一行とみなす文字の重なり
第2章画像の抽出・最適化
2.1 画像抽出
2.1.1 画像個数の取得
2.1.2 指定した画像を抽出
2.1.3 出力画像形式の指定
2.1.4 画像の大きさ、解像度を取得
2.2 画像の最適化
2.2.1 カラー画像最適化オプションの取得・指定
2.2.2 グレースケール画像最適化オプションの取得・指定
2.2.3 モノクロ画像最適化オプションの取得・指定
2.2.4 ダウンサンプリング方法の指定
2.2.5 最適化を行う画像の対象とするフィルターの指定
2.2.6 ダウンサンプリングする画素数の指定
2.2.7 ダウンサンプリング率の下限値の指定
2.2.8 ダウンサンプリング対象の画像をPPIで絞り込む
2.2.9 ダウンサンプリング後のPPI を指定する
2.3 JPEG 圧縮
2.3.1 JPEG 圧縮設定
第3章矩形内のデータ削除
3.1 マスクの特性
3.1.1 マスクの色
3.1.2 マスクの不透明度
3.2 削除する対象
3.2.1 テキスト：矩形内の文字を削除
3.2.2 テキスト：削除時オプションの指定
3.2.3 画像：矩形内の画像データを部分削除
3.2.4 図形：矩形内にパスデータ全体が含まれる場合に削除
3.3 テキスト検索：マスク処理
3.3.1 テキスト検索とマスク処理の組み合わせ
第4章フォントリソース
4.1 フォントの統合と埋め込み
4.1.1 フォントの統合
4.1.2 フォントの埋め込み
第5章 PDF の最適化
5.1 画像の最適化
5.1.1 画像の最適化
5.2 不要なデータの削除
5.2.1 オープンアクションの削除
5.2.2 しおりの削除
5.2.3 注釈・フォームの削除
5.2.4 アーティクルの削除
5.2.5 サムネールの削除
第6章レイヤー作成
6.1 レイヤーの作成・追加
6.1.1 レイヤーに使用するPDF 文書ページを設定
6.1.2 レイヤーの名前の指定
6.1.3 レイヤーの不透明度の指定
6.1.4 回転角度の設定
6.1.5 レイヤーのZ オーダーの指定
6.1.6 レイヤーの表示/非表示の指定
索引

紙版（プリントオンデマンド）
出版社: アンテナハウスCAS電子出版
発売日：2018年10月下旬（予定）
サイズ：B5判横組み
ページ数：126ページ
価格（税込）：1,728円
ISBN：978-4-900552-64-7
販売店：アマゾン（10月22日発売予定）

デジタル版（PDF）
販売形式：PDF版（DRMなし）
ページ数：126ページ
価格（税込み）：864円
販売店：アンテナハウス・オンラインショップ（PDFのダウンロード）

HTML版
Webで全文公開中

シリーズ既刊本紹介ページへのリンク
『PDF CookBook』
『PDF CookBook 第2巻』
『PDF CookBook 第4巻』

投票をお願いいたします

『PDF Cook Book』シリーズ　PDF Tool APIを使うPDFの料理法　のご紹介

PDFの料理本『PDF CookBook』（4月発売）および『PDF CookBook第2巻』（6月発売）は、PDF Tool API V5のクラスライブラリーを使ってできるPDFの様々な加工法を紹介しています。

『PDF CookBook』
PDFのページ編集（PDFの分割・結合・ページの回転）、ページサイズ、方向および余白の変更、PDFのページにテキスト・画像・PDFを貼り付けなどを中心に解説・活用例とプログラム例を解説しています。詳細はこちらへどうぞ。

出版社: アンテナハウスCAS電子出版
発売日：2018年4月
著者：アンテナハウス株式会社
販売形式：プリントオンデマンド版
サイズ：B5判横組み
ページ数：124ページ
価格（税込）：1,728円
ISBN：978-4-900552-60-9
販売店：アマゾン（POD版）（4月6日発売）、その他Web書店で発売予定

販売形式：PDF版（DRMなし）
ページ数：122ページ
価格（税込み）：864円
販売店：アンテナハウス・オンラインショップ（PDFのダウンロード）

『PDF CookBook第2巻』
PDFのセキュリィティ（パスワードセキュリティ）、閲覧制限、透かし、しおりなどについて等を中心に解説・活用例とプログラム例を解説しています。詳細はこちらへどうぞ。

出版社: アンテナハウスCAS電子出版
発売日：2018年6月中旬
著者：アンテナハウス株式会社
販売形式：プリントオンデマンド版
サイズ：B5判横組み
ページ数：126ページ
価格（税込）：1,728円　6月18日アマゾンで発売になりました。
ISBN：978-4-900552-61-6
販売店：アマゾン（POD版）その他Web書店で発売予定

販売形式：PDF版（DRMなし）
ページ数：126ページ
価格（税込み）：864円　6月8日発売
販売店：アンテナハウス・オンラインショップ（PDFのダウンロード）※PDF版のダウンロードは自社ストアのみです。

投票をお願いいたします

AH Formatter：PDFから複数行のテキストをコピペしたときに、不要な改行を避けるには。

こんにちは
『AH Formatter』サポート担当です。

『AH Formatter』で作成した PDF をビューアで表示して、
テキストをコピー＆テキストエディタなどにペースト（以下コピペ）した時に
改行が入ってしまうというお問い合わせをいただくことがあります。

具体的には、
　<fo:block>AH Formatterはアンテナハウス株式会社の製品です。</fo:block>
　<fo:block>最新版は弊社Webサイトからダウンロードできます。</fo:block>

これを組版した結果が以下のような場合
　組版結果
ここを Adobe Acrobat や Adobe Reader からコピペすると
次のようになります。

　AH Formatterはアンテナハウス株式会社
　の製品です。
　最新版は弊社Webサイトからダウンロー
　ドできます。

このように見た目のまま、改行されてしまっていますね。

データ中に改行コードが挿入されているわけではないので
この結果は PDFビューアに依存します。
別の PDFビューアでは

　AH Formatterはアンテナハウス株式会社の製品です。最新版は弊社Webサイトからダウンロードできます。

こんな風にひとつの連続したテキストでコピペされる場合もあります。
（改行位置に空白が入っています。）

では、”コピペした時に改行されないようにしたい” 場合はどうすればよいのでしょう。

PDFビューアに依存するので一概には言えないのですが
Adobe Acrobat や Adobe Reader の場合には
『AH Formatter』から “タグ付きPDF” として出力すると
次のようにコピペできます。

　AH Formatterはアンテナハウス株式会社の製品です。
　最新版は弊社Webサイトからダウンロードできます。

こうすれば、元のテキストデータと同じように連続したテキストとしてコピペできます。
ただし、ひとつ注意することがあります。
例えば、下記のような場合です。

<fo:block linefeed-treatment=”preserve” >
　XfoObj axfo = null;
　try {
　axfo = new XfoObj();
　ErrDump eDump = new ErrDump();
　axfo.setMessageListener(eDump);
　axfo.setDocumentURI(args[0]);
　axfo.setOutputFilePath(args[1]);
　axfo.setExitLevel(4);
　axfo.execute();
　}
</fo:block>

マニュアルのソースコード説明などでよくあるケースですが、
ひとつの fo:block にまとめて記述して、
linefeed-treatment=”preserve” で改行コードを有効にした場合です。

AH Formatterでの組版結果は以下のようになります。
　

このような場合、タグ付けしていない PDF では見た目のまま改行してコピペされますが
タグ付きPDF として出力してコピペすると
fo:block内のテキストはひとつの連続したテキストになってしまいます。
したがって、1行ずつ fo:block で分割する必要があります。

投票をお願いいたします

Pages: 1 2 3 4 5 Next

I love software2!

ソフトウェアに愛を込めて by アンテナハウス株式会社

カテゴリー別アーカイブ: PDF のあれこれ

無料のPDF編集ツールはどの程度使えるか―Smallpdfは無料で使える？

弊社の有償ツールとの比較

PDF資料室へ

Google Chrome開発者版（86）でタグ付きPDFを出力[8/4修正]

タグ付きPDFとは

新ビューアは今のところリフロー表示に対応していないらしい

タグ付きPDFをChromeで出力する

ChromeでのHTMLとタグ付きPDFの補足資料

PDFの色指定（5）CIEベースカラースペース

参考

PDFの色指定（4） ICCプロファイル

暗号化されていてもPDFを開くときはご用心

『Antenna House PDF Tool API』（PDF Tool API）でページ単位に分割してみる(2)

Javaサンプルコード

入力サンプルPDF(総ページ数3)

出力サンプルPDF(1ページ目)

出力サンプルPDF(2ページ目)

出力サンプルPDF(3ページ目)

『Antenna House PDF Tool API』（PDF Tool API）でページ単位に分割してみる(1)

Javaサンプルコード

入力サンプルPDF(総ページ数3)

出力サンプルPDF(1ページ目)

出力サンプルPDF(2ページ目)

出力サンプルPDF(3ページ目)

「PDF CookBook 第3巻」プリント版発売しました。また、全文をWebで公開しています。

『PDF Cook Book』シリーズ　PDF Tool APIを使うPDFの料理法　のご紹介

AH Formatter：PDFから複数行のテキストをコピペしたときに、不要な改行を避けるには。

月	火	水	木	金	土	日
« 5月
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31