カテゴリー別アーカイブ: PDF活用

『Antenna House PDF Tool API』(PDF Tool API)でページ単位に分割してみる(1)

『Antenna House PDF Tool API』(PDF Tool API)は、PDFファイルの情報取得やPDFファイルの加工・編集を行うライブラリです。
PDFに関するさまざまな処理機能を搭載しています。
文書情報やページ数などの情報取得、ページの挿入や削除、透かしの挿入、セキュリティ設定などのファイル加工、ページコンテンツのテキストや画像の削除、画像の最適化(ダウンサンプリング)といったページ編集処理が可能です。

今回は『Antenna House PDF Tool API』(PDF Tool API)を使用して、複数ページのPDFを、1ページ単位に分割してみたいと思います。

Javaサンプルコード

Javaサンプルコード(ExtractPage)のダウンロード(ZIP)

入力元PDFから1ページ単位で取り出し、出力先PDFを生成します。
この時、入力PDFの文書情報を、出力先PDFに設定しています。

入力サンプルPDF(総ページ数3)

pdftool.6.0

出力サンプルPDF(1ページ目)

pdftool.6.0.page1

出力サンプルPDF(2ページ目)

pdftool.6.0.page2

出力サンプルPDF(3ページ目)

pdftool.6.0.page3

入力元PDFが1000ページであれば、出力先PDFは1000ファイルになります。
分割条件を変更すれば10ページ単位や、特定の文字列をキーに、そのページで分割なども可能です。

製品に関するご質問は
sis@antenna.co.jp(SYSTEM担当)
または
oem@antenna.co.jp(OEM担当)
まで、お気軽にお問い合わせください。

評価版のお申込
評価版のお申込ページ

Webページ
https://www.antenna.co.jp/ptl/




瞬簡PDF 編集 2024
かんたん操作でPDFを自由自在に編集


瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品!

EPUBtoPDF変換ツールを使ってみる(Formatter最新バージョン対応)

ご無沙汰しております。
本日と明日のブログは、電子出版サービスグループからお送りいたします。

Formatter 最新バージョンに対応

「EPUBtoPDF変換ツール」は、ときどき、地味に引き合いがあります。EPUBをPDFにするという需要自体が、まだまだ少ないので引き合いが少ないのはやむを得ないところです。製品の方も少しずつですが、バージョンアップしています。

今回、AH Formatterのバージョンアップ(V6.6MR1)に合わせて同バージョンに対応しました。劇的な変化はありませんが、昨今の縦組み横組み混じりのEPUBも、そのとおりにPDF変換できますし、CSSからのページ組版上、行間のアキ処理で不自然に1,2行ほどページの最後の行が空いてしまう問題も、軽減しました。

  • 縦組みの中に横組みのページがある場合のパラメータ設定:mixed-writing-mode=”true”
  • ページ最後の空白軽減のパラメータ設定:baseline-grid=”true”

ただし、ページ最後の空白軽減については、行数(lines)が指定されているものに限ります。行数が設定されていない場合は無効ですのでご注意ください。

 

EPUBの本文と奥付

PDF変換してみる

上図は、EPUBの本文が縦書き、奥付を横組みに設定した例です。その下の図は、EPUBtoPDF変換ツールを使い、PDF変換してみた例です。
(出典:青空文庫-幸福のうわおい靴)

※余白等デザインがよろしくないのは、このためだけに作った見本EPUB/PDFなので、単純にCSSやツール側のパラメータ設定をしていないだけです。

これで、小洒落た(?)デザインのEPUBも、まずまずの出来具合でPDF変換が可能になりました。

「EPUBtoPDF変換ツール」はライセンスの販売のみではなく、これを使った変換サービスも承ります。EPUBの校正のためにPDFにしている版元さんもいらっしゃいます。EPUBから紙書籍の出版を考えている版元様、制作会社様、このままPDF入稿もできればイメージを掴むための校正用としてもご利用いただけますので、ぜひお問い合わせください。

「EPUBtoPDF変換ツール」のご紹介ページ

<お問い合わせ先>
電子出版サービスグループ:cas-info@antenna.co.jp




瞬簡PDF 作成 2024
ドラッグ&ドロップでPDF作成


瞬簡PDF 変換 2024
PDFをOffice文書へ高精度変換

よくあるお問い合わせ「旧製品の購入とサポート」

デスクトップ製品のサポートは販売終了後1年まで

アンテナハウスでは、WindowsなどのOSが動いているパソコンにインストールして、パソコンの画面上でご利用いただくソフトウエアを、デスクトップ製品と呼んでいます。

デスクトップ製品は、原則、販売終了後1年でサポートを終了いたします。また、ユーザー登録をされ、製品の登録がお済のお客様は、お客様の専用ページより製品のインストーラーをダウンロード(クロスメディアサービス)できますが、このダウンロード可能な期間も、サポートと同じく販売終了後1年までとなります。

古い在庫品にはご注意ください

製品が販売終了しますと、その日以降、弊社からその製品のご購入ができなくなります。なお、まれに店頭などで古い製品の在庫がある場合がございます。もし、その製品がすでに発売終了となっていた場合、サポートが販売終了から1年間のため、サポートが受けられないケースがございます。ご購入の際は、最新版かどうかを弊社のホームページでご確認をいただきますよう、お願い申し上げます。

なお、旧製品の不具合などを改修する改訂版(アップデータ)のみ、各製品の改訂版のページでダウンロードが可能です。※公開しているページに限ります。

インストーラーは製品そのもの

最近はWindows 10が主流になり、パソコンの入れ替え需要も多いようです。その際、アンテナハウスのデスクトップ製品(ソフトウエア)はコピーしただけでは移動できません。ソフトウエアの入れ替えの際は必ずインストーラーが必要です。

インストーラーが収録されているCD-ROMやDVD-ROM、あるいはダウンロードされたファイル(インストーラー)は、それこそがご購入された製品です。パソコンにインストールした後も、そうしたCD-ROMやDVD-ROMやファイルはしっかりと保存・管理をお願いいたします。

 




瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識


瞬簡PDF 変換 2024
PDFをOffice文書へ高精度変換

「PDF CookBook 第3巻」プリント版発売しました。また、全文をWebで公開しています。

電子の紙PDFを企業向けのシステムの中で編集したり、加工したりする方法を紹介するPDFの料理本シリーズ『PDF CookBook 第3巻』ができあがりました。

PDF CookBook 表紙

本書は、紙版をアマゾンなどからプリントオンデマンドで販売、PDF版(ダウンロード)はアンテナハウスのオンラインストアから販売、HTMLはPDF Tool APIのWebページにて全文を公開しています。

『PDF CookBook 第3巻』ではPDFからテキストを抽出・検索する機能、PDFから画像の抽出・画像の最適化、矩形内のデータ削除と塗りつぶし(墨消し)、フォントの統合・埋め込み、PDFの最適化、PDFにレイヤーを追加する機能など豊富なテーマを扱います。

各機能の解説・役割や目的、見込まれる効果の紹介、PDF Tool APIによるサンプルプログラム、処理実行例を紹介しています。PDFを扱うプログラマーはもちろんですが、企画・営業担当の方でもPDFの豊富な機能や使い方についての知識やアイデアが得られるでしょう。

目次
はじめに
第1章 テキストの抽出・検索
1.1 テキスト抽出
1.1.1 ページから全テキスト抽出
1.1.2 指定矩形からテキストを抽出
1.2 テキスト検索
1.2.1 キーワードの指定による検索
1.2.2 検索オプションの指定:検索対象文字列のオプション
1.2.3 検索オプションの指定:取得順序
1.2.4 検索オプションの指定:同一行とみなす文字の重なり
第2章 画像の抽出・最適化
2.1 画像抽出
2.1.1 画像個数の取得
2.1.2 指定した画像を抽出
2.1.3 出力画像形式の指定
2.1.4 画像の大きさ、解像度を取得
2.2 画像の最適化
2.2.1 カラー画像最適化オプションの取得・指定
2.2.2 グレースケール画像最適化オプションの取得・指定
2.2.3 モノクロ画像最適化オプションの取得・指定
2.2.4 ダウンサンプリング方法の指定
2.2.5 最適化を行う画像の対象とするフィルターの指定
2.2.6 ダウンサンプリングする画素数の指定
2.2.7 ダウンサンプリング率の下限値の指定
2.2.8 ダウンサンプリング対象の画像をPPIで絞り込む
2.2.9 ダウンサンプリング後のPPI を指定する
2.3 JPEG 圧縮
2.3.1 JPEG 圧縮設定
第3章 矩形内のデータ削除
3.1 マスクの特性
3.1.1 マスクの色
3.1.2 マスクの不透明度
3.2 削除する対象
3.2.1 テキスト:矩形内の文字を削除
3.2.2 テキスト:削除時オプションの指定
3.2.3 画像:矩形内の画像データを部分削除
3.2.4 図形:矩形内にパスデータ全体が含まれる場合に削除
3.3 テキスト検索:マスク処理
3.3.1 テキスト検索とマスク処理の組み合わせ
第4章フォントリソース
4.1 フォントの統合と埋め込み
4.1.1 フォントの統合
4.1.2 フォントの埋め込み
第5章 PDF の最適化
5.1 画像の最適化
5.1.1 画像の最適化
5.2 不要なデータの削除
5.2.1 オープンアクションの削除
5.2.2 しおりの削除
5.2.3 注釈・フォームの削除
5.2.4 アーティクルの削除
5.2.5 サムネールの削除
第6章 レイヤー作成
6.1 レイヤーの作成・追加
6.1.1 レイヤーに使用するPDF 文書ページを設定
6.1.2 レイヤーの名前の指定
6.1.3 レイヤーの不透明度の指定
6.1.4 回転角度の設定
6.1.5 レイヤーのZ オーダーの指定
6.1.6 レイヤーの表示/非表示の指定
索引

紙版(プリントオンデマンド)
出版社: アンテナハウスCAS電子出版
発売日:2018年10月下旬(予定)
サイズ:B5判 横組み
ページ数:126ページ
価格(税込):1,728円
ISBN:978-4-900552-64-7
販売店:アマゾン(10月22日発売予定)

デジタル版(PDF)
販売形式:PDF版(DRMなし)
ページ数:126ページ
価格(税込み):864円
販売店:アンテナハウス・オンラインショップ(PDFのダウンロード)

HTML版
Webで全文公開中

シリーズ既刊本紹介ページへのリンク
『PDF CookBook』
『PDF CookBook 第2巻』
『PDF CookBook 第4巻』




瞬簡PDF 編集 2024
かんたん操作でPDFを自由自在に編集


瞬簡PDF 作成 2024
ドラッグ&ドロップでPDF作成

PDF関連デスクトップ製品「機能比較表」更新

「瞬簡PDF」シリーズの機能比較表

アンテナハウスのデスクトップPDF製品の機能比較表を7月20日に更新しました。

上記は弊社のPDFデスクトップ製品のうち、「瞬簡PDF 統合版 」や「瞬簡PDF 統合版 」に含まれている下記製品の機能比較表です。

  • 「瞬簡PDF 作成 8」は、PDFを簡単に作成するソフト
  • 「瞬簡PDF 編集 7」は、PDF作成に加えて、PDFの文字編集や画像の差し替ができるソフト
  • 「瞬簡PDF 変換 10」は、PDFからOfficeなどの形式へ精度よく変換するソフト
  • 「瞬簡PDF 書けまっせ 7」は、用紙PDFへのデータ書き込み・追記に特化したソフト
  • 「瞬簡PDF 統合版 10」は、PDFの編集操作に加えて、上記の4製品プラス「瞬簡PDF OCR」をセットにした製品(※同梱製品は「瞬簡PDF 変換  9」)
  • 「瞬簡PDF 統合版 10 官公庁向け」は、「瞬簡PDF 統合版 10」プラス「瞬簡PDF to Image」「瞬簡PDF サイン 2」をセットにした製品(※同梱製品は「瞬簡PDF 変換  9」)

PDFはその作成から加工まで実にたくさんの処理があります。効率よく作業するには、その目的に最適化されたツール(ソフトウエア)が便利です。弊社では、それぞれの製品について、利用イメージを想定し、その用途において必要な機能を備え、使い易く、コストパーフォーマンスの良い製品を作りたいと考えています。

弊社製品の選択や他社製品との比較等にぜひご活用いただければ幸いです。




瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識


HTML on Word
WebページをWordで作る!

『PDF Cook Book』シリーズ PDF Tool APIを使うPDFの料理法 のご紹介

PDFの料理本『PDF CookBook』(4月発売)および『PDF CookBook第2巻』(6月発売)は、PDF Tool API V5のクラスライブラリーを使ってできるPDFの様々な加工法を紹介しています。

『PDF CookBook』
PDFのページ編集(PDFの分割・結合・ページの回転)、ページサイズ、方向および余白の変更、PDFのページにテキスト・画像・PDFを貼り付けなどを中心に解説・活用例とプログラム例を解説しています。詳細はこちらへどうぞ

出版社: アンテナハウスCAS電子出版
発売日:2018年4月
著者:アンテナハウス株式会社
販売形式:プリントオンデマンド版
サイズ:B5判 横組み
ページ数:124ページ
価格(税込):1,728円
ISBN:978-4-900552-60-9
販売店:アマゾン(POD版)(4月6日発売)、その他Web書店で発売予定

販売形式:PDF版(DRMなし)
ページ数:122ページ
価格(税込み):864円
販売店:アンテナハウス・オンラインショップ(PDFのダウンロード)

『PDF CookBook第2巻』
PDFのセキュリィティ(パスワードセキュリティ)、閲覧制限、透かし、しおりなどについて等を中心に解説・活用例とプログラム例を解説しています。詳細はこちらへどうぞ

出版社: アンテナハウスCAS電子出版
発売日:2018年6月中旬
著者:アンテナハウス株式会社
販売形式:プリントオンデマンド版
サイズ:B5判 横組み
ページ数:126ページ
価格(税込):1,728円 6月18日アマゾンで発売になりました。
ISBN:978-4-900552-61-6
販売店:アマゾン(POD版)その他Web書店で発売予定

販売形式:PDF版(DRMなし)
ページ数:126ページ
価格(税込み):864円 6月8日発売
販売店:アンテナハウス・オンラインショップ(PDFのダウンロード)※PDF版のダウンロードは自社ストアのみです。




瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識


瞬簡PDF 変換 2024
PDFをOffice文書へ高精度変換

「Antenna House AHPDFXML 変換ライブラリ V2.0」の出力例 (フォント情報)

「Antenna House AHPDFXML 変換ライブラリ V2.0」は、PDFファイルの内部データを、XML(Extensible Markup Language:拡張可能なマークアップ言語)形式に変換するプログラムです。
このライブラリが出力するXML形式を「AHPDFXML形式」と呼びます。
PDF解析技術により文書構造を生成して、再利用に適したXMLデータを出力します。

今回は”フォント情報”がAHPDFXMLに出力される例を見てみます。
変換元PDFファイルのスクリーンショットです。
サンプルは、文字列”材料(3人分)”です。

ahpdfxml_pdf_0205

上記のPDFをAHPDFXML形式に変換したXMLの内容は次の通りです。

ドキュメントXMLの内容です。

文字は複数の ahp:run に分割されています。これは元の PDF 内で、文字の配置が分かれているためです。
どの文字も、スタイルXMLを参照するIDは ahp:s-id=s5 となっています。

スタイルXMLの内容です。

ahpdfxml_xml_0205b

  • フォント名 ahp:name=MS-Mincho
  • フォントサイズ ahp:size=18.000000
  • 強調表示 ahp:bold=true
  • 文字色は赤 ahp:color ahp:rgb=#f00000
  • 強調表示 ahp:bold=true
  • 下線は1本線の赤 ahp:border-b ahp:border-type=single ahp:width=1.000000 ahp:color ahp:rgb=#f00000

PDFファイルの中に含まれる文字やフォント情報を取り出すことができます。

XMLで表現することによって、データの扱いが容易になります。
XMLのメリットを最大限に活かしてPDFデータを活用できます。
弊社ウエブサイトより評価版の申し込みが可能です。是非ご評価ください。

製品に関するご質問は
sis@antenna.co.jp(SYSTEM担当)
または
oem@antenna.co.jp(OEM担当)
まで、お気軽にお問い合わせください。

評価版のお申込
評価版のお申込ページ

Webページ
https://www.antenna.co.jp/pdfxml/




瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品!


HTML on Word
WebページをWordで作る!

「Antenna House AHPDFXML 変換ライブラリ V2.0」の出力例 (画像情報)

「Antenna House AHPDFXML 変換ライブラリ V2.0」は、PDFファイルの内部データを、
XML(Extensible Markup Language:拡張可能なマークアップ言語)形式に変換するプログラムです。
このライブラリが出力するXML形式を「AHPDFXML形式」と呼びます。
PDF解析技術により文書構造を生成して、再利用に適したXMLデータを出力します。

今回は”画像情報”がAHPDFXMLに出力される例を見てみます。
変換元PDFファイルのスクリーンショットです。
サンプルは、画像”野菜のかご盛り”です。

ahpdfxml_pdf_0202

上記のPDFをAHPDFXML形式に変換したXMLの内容は次の通りです。

ドキュメントXMLの内容です。

ahpdfxml_xml_0202a

  • イメージフレーム ahp:frame-type=image
  • 領域の座標 ahp:l ahp:r ahp:t ahp:b
  • カタログXMLを参照するID ahp:file-id=f1

カタログXMLの内容です。
ahpdfxml_xml_0202b

  • 外部ファイル名 ahp:href=pdf2tmp_0.bmp
  • 画像はBMP ahp:file-type=BMP
  • 参照されるID ahp:id=f1

AHPDFXMLの出力先フォルダのスクリーンショットです。
画像ファイル pdf2tmp_0.bmp が出力されているのがわかります。

ahpdfxml_ss_0202

PDFファイルの中に含まれる画像を取り出すことができます。

XMLで表現することによって、データの扱いが容易になります。
XMLのメリットを最大限に活かしてPDFデータを活用できます。
弊社ウエブサイトより評価版の申し込みが可能です。是非ご評価ください。

製品に関するご質問は
sis@antenna.co.jp(SYSTEM担当)
または
oem@antenna.co.jp(OEM担当)
まで、お気軽にお問い合わせください。

評価版のお申込
評価版のお申込ページ

Webページ
https://www.antenna.co.jp/pdfxml/




アウトライナー
PDFを解析して しおり・目次を自動生成


瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品!

デスクトップ製品のサイトライセンスは10本から

デスクトップ製品とは

アンテナハウスでは、パソコンの本体にインストール(仮想環境は除く)して、そのパソコンの画面で操作することのできるパソコン用ソフトウエアのことを「デスクトップ製品」と呼んでいます。もちろんノートパソコン(ノートPC)でも同じように動かすことができます。

【参考】デスクトップ製品、システム製品とは?

サイトライセンスとは

デスクトップ製品を複数のパソコンに導入(インストール)してご利用の場合、必要な数だけデスクトップ製品をお求めいただくか、必要な数をライセンス(証書による使用許諾)でご購入いただく方法があります。サイトライセンスとはそうしたライセンスのひとつです。

【参考】サイトライセンスとシンクライアントライセンス

ただし、サイトライセンスは10ライセンス以上をまとめてご購入いただく必要があります。下記のページでは、10ライセンス以上をご購入の際の1ライセンス当たりの価格(=単価)をご紹介しています。

【参考】アンテナハウス デスクトップ製品のライセンス販売の価格とお申し込み

ひとつのデスクトップ製品をダウンロード版などでおおよそ6本以上ご購入予定であれば、サイトライセンスの最低数10本の価格の方が割安になってくる計算です。ぜひご検討ください。




瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識


瞬簡PDF 変換 2024
PDFをOffice文書へ高精度変換

『瞬簡PDF 統合版 10』特別価格キャンペーン

アンテナハウスオンラインショップでは『瞬簡PDF 統合版 10』特別価格キャンペーンを開催中です。期間は1月30日16時まで。

『瞬簡PDF 統合版 10』はPDFを最大限に活用できる『瞬簡PDFシリーズ』の 5 製品を同梱したお得なパッケージです。 作成・編集・一括Office変換・OCR変換・記入の各機能が使えます。

今回は、優待版、アップグレード版、サイトライセンス版がそれぞれ通常価格よりお求めやすい価格になっています。『瞬簡PDFシリーズ』のいずれかをすでにお持ちなら、今お持ちの製品を『瞬簡PDF 統合版 10』にできるアップグレード版がお勧めです。

年に数回のチャンスです。 決めかねている方、迷われている方も、ぜひ、この機会に『瞬簡PDF 統合版 10』をご検討下さい。

キャンペーンのURLはこちらです。
https://web.antenna.co.jp/shop/html/products/list.php?category_id=321

「PDFって何」と思った方、まずは下記のページでPDFの基礎をささっと身につけましょう。
アンテナハウス PDF資料室




瞬簡PDF 作成 2024
ドラッグ&ドロップでPDF作成


瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品!
Pages: Prev 1 2 3 4 5 6 7 8 9 10 ... 19 20 21 Next