カテゴリー別アーカイブ: PDF活用

『Antenna House PDF to Office 変換ライブラリ』 改訂版のお知らせ

本日は、コンバータ製品グループからの投稿です。

Antenna House PDF to Office 変換ライブラリ』は、弊社パッケージ製品『瞬簡PDF 変換 シリーズ』の高精度変換エンジン(PDF→Word/PDF→Excel/PDF→PowerPoint)を各種アプリケーションから利用するための組み込み専用ライブラリです。
今回、新たに改訂版(1.4.0)を公開しました。

改訂の主な目玉は、OCR機能(オプション)に使用するOCRエンジンの刷新です。
まったく新しいOCRエンジンの採用により、日本語・英語を含む約40の言語で使用される文字を認識できるようになりました。
OCR処理の対象データに使用されている言語種別を指定することで、日中韓はもちろん、ラテン系文字、ギリシャ文字、キリル文字をそれぞれ識別します。
文字を正しく識別することで、表組みや段組みなどの書式もより高精度に変換できるようになります。

対応する言語やライブラリの詳細は ライブラリの概要 から確認することができます。

本ライブラリの活用をご検討いただければ幸いです。


『Antenna House PDF to Office 変換ライブラリ』は、ソフトウェアの開発会社等が開発するPDFソリューション、ISV(独立系ソフトウェア・ベンダ)が開発するPDFアプリケーションに組み込んで再配布するためのOEMライセンスのみ販売しております。

価格は、組み込み条件等により異なります。
詳しくは、oem@antenna.co.jp までお問い合わせください。




アウトライナー
PDFを解析して しおり・目次を自動生成


瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品!

PDF Tool API (C#の場合)

いろんな機能がいろいろ紹介されてるPDF Tool APIですが

参考
たったこれだけで 9行目で指定した入力PDFをロードして10行目で指定した出力PDFとして保存できます。

あとはロードと保存の間でPDFの処理をするだけ。

PDF CookBook 第1巻
PDF CookBook 第2巻
PDF CookBook 第3巻
各処理の詳細な説明も取りそろっております。




瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識


瞬簡PDF 編集 2024
かんたん操作でPDFを自由自在に編集

『Antenna House PDF Tool API』(PDF Tool API)でページ単位に分割してみる(2)

『Antenna House PDF Tool API』(PDF Tool API)は、PDFファイルの情報取得やPDFファイルの加工・編集を行うライブラリです。
PDFに関するさまざまな処理機能を搭載しています。
文書情報やページ数などの情報取得、ページの挿入や削除、透かしの挿入、セキュリティ設定などのファイル加工、ページコンテンツのテキストや画像の削除、画像の最適化(ダウンサンプリング)といったページ編集処理が可能です。

今回は『Antenna House PDF Tool API』(PDF Tool API)を使用して、複数ページのPDFを、1ページ単位に分割しながら、リンク注釈を設定します。
設定されたリンク注釈をクリックすると、前後のページのPDFを呼び出します。

Javaサンプルコード

Javaサンプルコード(ExtractPageAndLink)のダウンロード(ZIP)

入力元PDFから1ページ単位で取り出し、出力先PDFを生成します。
この時、入力PDFの文書情報を、出力先PDFに設定しています。
更に、前後ページのPDFファイルへリンク注釈を設定しています。

入力サンプルPDF(総ページ数3)

pdftool.6.0.sample

出力サンプルPDF(1ページ目)

次ページのPDFファイル(output_page_2.pdf)へのリンク注釈です。

pdftool.6.0.page1

出力サンプルPDF(2ページ目)

前ページのPDFファイル(output_page_1.pdf)へのリンク注釈です。

次ページのPDFファイル(output_page_3.pdf)へのリンク注釈です。

pdftool.6.0.page2

出力サンプルPDF(3ページ目)

前ページのPDFファイル(output_page_2.pdf)へのリンク注釈です。

pdftool.6.0.page3

索引用のPDFファイルを作成して、分割したPDFファイルへリンク注釈を設定するなども可能です。




瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識


瞬簡PDF 変換 2024
PDFをOffice文書へ高精度変換

『Antenna House PDF Tool API』(PDF Tool API)でページ単位に分割してみる(1)

『Antenna House PDF Tool API』(PDF Tool API)は、PDFファイルの情報取得やPDFファイルの加工・編集を行うライブラリです。
PDFに関するさまざまな処理機能を搭載しています。
文書情報やページ数などの情報取得、ページの挿入や削除、透かしの挿入、セキュリティ設定などのファイル加工、ページコンテンツのテキストや画像の削除、画像の最適化(ダウンサンプリング)といったページ編集処理が可能です。

今回は『Antenna House PDF Tool API』(PDF Tool API)を使用して、複数ページのPDFを、1ページ単位に分割してみたいと思います。

Javaサンプルコード

Javaサンプルコード(ExtractPage)のダウンロード(ZIP)

入力元PDFから1ページ単位で取り出し、出力先PDFを生成します。
この時、入力PDFの文書情報を、出力先PDFに設定しています。

入力サンプルPDF(総ページ数3)

pdftool.6.0

出力サンプルPDF(1ページ目)

pdftool.6.0.page1

出力サンプルPDF(2ページ目)

pdftool.6.0.page2

出力サンプルPDF(3ページ目)

pdftool.6.0.page3

入力元PDFが1000ページであれば、出力先PDFは1000ファイルになります。
分割条件を変更すれば10ページ単位や、特定の文字列をキーに、そのページで分割なども可能です。

製品に関するご質問は
sis@antenna.co.jp(SYSTEM担当)
または
oem@antenna.co.jp(OEM担当)
まで、お気軽にお問い合わせください。

評価版のお申込
評価版のお申込ページ

Webページ
https://www.antenna.co.jp/ptl/




瞬簡PDF 変換 2024
PDFをOffice文書へ高精度変換


HTML on Word
WebページをWordで作る!

EPUBtoPDF変換ツールを使ってみる(Formatter最新バージョン対応)

ご無沙汰しております。
本日と明日のブログは、電子出版サービスグループからお送りいたします。

Formatter 最新バージョンに対応

「EPUBtoPDF変換ツール」は、ときどき、地味に引き合いがあります。EPUBをPDFにするという需要自体が、まだまだ少ないので引き合いが少ないのはやむを得ないところです。製品の方も少しずつですが、バージョンアップしています。

今回、AH Formatterのバージョンアップ(V6.6MR1)に合わせて同バージョンに対応しました。劇的な変化はありませんが、昨今の縦組み横組み混じりのEPUBも、そのとおりにPDF変換できますし、CSSからのページ組版上、行間のアキ処理で不自然に1,2行ほどページの最後の行が空いてしまう問題も、軽減しました。

  • 縦組みの中に横組みのページがある場合のパラメータ設定:mixed-writing-mode=”true”
  • ページ最後の空白軽減のパラメータ設定:baseline-grid=”true”

ただし、ページ最後の空白軽減については、行数(lines)が指定されているものに限ります。行数が設定されていない場合は無効ですのでご注意ください。

 

EPUBの本文と奥付

PDF変換してみる

上図は、EPUBの本文が縦書き、奥付を横組みに設定した例です。その下の図は、EPUBtoPDF変換ツールを使い、PDF変換してみた例です。
(出典:青空文庫-幸福のうわおい靴)

※余白等デザインがよろしくないのは、このためだけに作った見本EPUB/PDFなので、単純にCSSやツール側のパラメータ設定をしていないだけです。

これで、小洒落た(?)デザインのEPUBも、まずまずの出来具合でPDF変換が可能になりました。

「EPUBtoPDF変換ツール」はライセンスの販売のみではなく、これを使った変換サービスも承ります。EPUBの校正のためにPDFにしている版元さんもいらっしゃいます。EPUBから紙書籍の出版を考えている版元様、制作会社様、このままPDF入稿もできればイメージを掴むための校正用としてもご利用いただけますので、ぜひお問い合わせください。

「EPUBtoPDF変換ツール」のご紹介ページ

<お問い合わせ先>
電子出版サービスグループ:cas-info@antenna.co.jp




アウトライナー
PDFを解析して しおり・目次を自動生成


瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識

よくあるお問い合わせ「旧製品の購入とサポート」

デスクトップ製品のサポートは販売終了後1年まで

アンテナハウスでは、WindowsなどのOSが動いているパソコンにインストールして、パソコンの画面上でご利用いただくソフトウエアを、デスクトップ製品と呼んでいます。

デスクトップ製品は、原則、販売終了後1年でサポートを終了いたします。また、ユーザー登録をされ、製品の登録がお済のお客様は、お客様の専用ページより製品のインストーラーをダウンロード(クロスメディアサービス)できますが、このダウンロード可能な期間も、サポートと同じく販売終了後1年までとなります。

古い在庫品にはご注意ください

製品が販売終了しますと、その日以降、弊社からその製品のご購入ができなくなります。なお、まれに店頭などで古い製品の在庫がある場合がございます。もし、その製品がすでに発売終了となっていた場合、サポートが販売終了から1年間のため、サポートが受けられないケースがございます。ご購入の際は、最新版かどうかを弊社のホームページでご確認をいただきますよう、お願い申し上げます。

なお、旧製品の不具合などを改修する改訂版(アップデータ)のみ、各製品の改訂版のページでダウンロードが可能です。※公開しているページに限ります。

インストーラーは製品そのもの

最近はWindows 10が主流になり、パソコンの入れ替え需要も多いようです。その際、アンテナハウスのデスクトップ製品(ソフトウエア)はコピーしただけでは移動できません。ソフトウエアの入れ替えの際は必ずインストーラーが必要です。

インストーラーが収録されているCD-ROMやDVD-ROM、あるいはダウンロードされたファイル(インストーラー)は、それこそがご購入された製品です。パソコンにインストールした後も、そうしたCD-ROMやDVD-ROMやファイルはしっかりと保存・管理をお願いいたします。

 




瞬簡PDF 変換 2024
PDFをOffice文書へ高精度変換


瞬簡PDF 編集 2024
かんたん操作でPDFを自由自在に編集

「PDF CookBook 第3巻」プリント版発売しました。また、全文をWebで公開しています。

電子の紙PDFを企業向けのシステムの中で編集したり、加工したりする方法を紹介するPDFの料理本シリーズ『PDF CookBook 第3巻』ができあがりました。

PDF CookBook 表紙

本書は、紙版をアマゾンなどからプリントオンデマンドで販売、PDF版(ダウンロード)はアンテナハウスのオンラインストアから販売、HTMLはPDF Tool APIのWebページにて全文を公開しています。

『PDF CookBook 第3巻』ではPDFからテキストを抽出・検索する機能、PDFから画像の抽出・画像の最適化、矩形内のデータ削除と塗りつぶし(墨消し)、フォントの統合・埋め込み、PDFの最適化、PDFにレイヤーを追加する機能など豊富なテーマを扱います。

各機能の解説・役割や目的、見込まれる効果の紹介、PDF Tool APIによるサンプルプログラム、処理実行例を紹介しています。PDFを扱うプログラマーはもちろんですが、企画・営業担当の方でもPDFの豊富な機能や使い方についての知識やアイデアが得られるでしょう。

目次
はじめに
第1章 テキストの抽出・検索
1.1 テキスト抽出
1.1.1 ページから全テキスト抽出
1.1.2 指定矩形からテキストを抽出
1.2 テキスト検索
1.2.1 キーワードの指定による検索
1.2.2 検索オプションの指定:検索対象文字列のオプション
1.2.3 検索オプションの指定:取得順序
1.2.4 検索オプションの指定:同一行とみなす文字の重なり
第2章 画像の抽出・最適化
2.1 画像抽出
2.1.1 画像個数の取得
2.1.2 指定した画像を抽出
2.1.3 出力画像形式の指定
2.1.4 画像の大きさ、解像度を取得
2.2 画像の最適化
2.2.1 カラー画像最適化オプションの取得・指定
2.2.2 グレースケール画像最適化オプションの取得・指定
2.2.3 モノクロ画像最適化オプションの取得・指定
2.2.4 ダウンサンプリング方法の指定
2.2.5 最適化を行う画像の対象とするフィルターの指定
2.2.6 ダウンサンプリングする画素数の指定
2.2.7 ダウンサンプリング率の下限値の指定
2.2.8 ダウンサンプリング対象の画像をPPIで絞り込む
2.2.9 ダウンサンプリング後のPPI を指定する
2.3 JPEG 圧縮
2.3.1 JPEG 圧縮設定
第3章 矩形内のデータ削除
3.1 マスクの特性
3.1.1 マスクの色
3.1.2 マスクの不透明度
3.2 削除する対象
3.2.1 テキスト:矩形内の文字を削除
3.2.2 テキスト:削除時オプションの指定
3.2.3 画像:矩形内の画像データを部分削除
3.2.4 図形:矩形内にパスデータ全体が含まれる場合に削除
3.3 テキスト検索:マスク処理
3.3.1 テキスト検索とマスク処理の組み合わせ
第4章フォントリソース
4.1 フォントの統合と埋め込み
4.1.1 フォントの統合
4.1.2 フォントの埋め込み
第5章 PDF の最適化
5.1 画像の最適化
5.1.1 画像の最適化
5.2 不要なデータの削除
5.2.1 オープンアクションの削除
5.2.2 しおりの削除
5.2.3 注釈・フォームの削除
5.2.4 アーティクルの削除
5.2.5 サムネールの削除
第6章 レイヤー作成
6.1 レイヤーの作成・追加
6.1.1 レイヤーに使用するPDF 文書ページを設定
6.1.2 レイヤーの名前の指定
6.1.3 レイヤーの不透明度の指定
6.1.4 回転角度の設定
6.1.5 レイヤーのZ オーダーの指定
6.1.6 レイヤーの表示/非表示の指定
索引

紙版(プリントオンデマンド)
出版社: アンテナハウスCAS電子出版
発売日:2018年10月下旬(予定)
サイズ:B5判 横組み
ページ数:126ページ
価格(税込):1,728円
ISBN:978-4-900552-64-7
販売店:アマゾン(10月22日発売予定)

デジタル版(PDF)
販売形式:PDF版(DRMなし)
ページ数:126ページ
価格(税込み):864円
販売店:アンテナハウス・オンラインショップ(PDFのダウンロード)

HTML版
Webで全文公開中

シリーズ既刊本紹介ページへのリンク
『PDF CookBook』
『PDF CookBook 第2巻』
『PDF CookBook 第4巻』




アウトライナー
PDFを解析して しおり・目次を自動生成


瞬簡PDF 変換 2024
PDFをOffice文書へ高精度変換

PDF関連デスクトップ製品「機能比較表」更新

「瞬簡PDF」シリーズの機能比較表

アンテナハウスのデスクトップPDF製品の機能比較表を7月20日に更新しました。

上記は弊社のPDFデスクトップ製品のうち、「瞬簡PDF 統合版 」や「瞬簡PDF 統合版 」に含まれている下記製品の機能比較表です。

  • 「瞬簡PDF 作成 8」は、PDFを簡単に作成するソフト
  • 「瞬簡PDF 編集 7」は、PDF作成に加えて、PDFの文字編集や画像の差し替ができるソフト
  • 「瞬簡PDF 変換 10」は、PDFからOfficeなどの形式へ精度よく変換するソフト
  • 「瞬簡PDF 書けまっせ 7」は、用紙PDFへのデータ書き込み・追記に特化したソフト
  • 「瞬簡PDF 統合版 10」は、PDFの編集操作に加えて、上記の4製品プラス「瞬簡PDF OCR」をセットにした製品(※同梱製品は「瞬簡PDF 変換  9」)
  • 「瞬簡PDF 統合版 10 官公庁向け」は、「瞬簡PDF 統合版 10」プラス「瞬簡PDF to Image」「瞬簡PDF サイン 2」をセットにした製品(※同梱製品は「瞬簡PDF 変換  9」)

PDFはその作成から加工まで実にたくさんの処理があります。効率よく作業するには、その目的に最適化されたツール(ソフトウエア)が便利です。弊社では、それぞれの製品について、利用イメージを想定し、その用途において必要な機能を備え、使い易く、コストパーフォーマンスの良い製品を作りたいと考えています。

弊社製品の選択や他社製品との比較等にぜひご活用いただければ幸いです。




HTML on Word
WebページをWordで作る!


瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品!

『PDF Cook Book』シリーズ PDF Tool APIを使うPDFの料理法 のご紹介

PDFの料理本『PDF CookBook』(4月発売)および『PDF CookBook第2巻』(6月発売)は、PDF Tool API V5のクラスライブラリーを使ってできるPDFの様々な加工法を紹介しています。

『PDF CookBook』
PDFのページ編集(PDFの分割・結合・ページの回転)、ページサイズ、方向および余白の変更、PDFのページにテキスト・画像・PDFを貼り付けなどを中心に解説・活用例とプログラム例を解説しています。詳細はこちらへどうぞ

出版社: アンテナハウスCAS電子出版
発売日:2018年4月
著者:アンテナハウス株式会社
販売形式:プリントオンデマンド版
サイズ:B5判 横組み
ページ数:124ページ
価格(税込):1,728円
ISBN:978-4-900552-60-9
販売店:アマゾン(POD版)(4月6日発売)、その他Web書店で発売予定

販売形式:PDF版(DRMなし)
ページ数:122ページ
価格(税込み):864円
販売店:アンテナハウス・オンラインショップ(PDFのダウンロード)

『PDF CookBook第2巻』
PDFのセキュリィティ(パスワードセキュリティ)、閲覧制限、透かし、しおりなどについて等を中心に解説・活用例とプログラム例を解説しています。詳細はこちらへどうぞ

出版社: アンテナハウスCAS電子出版
発売日:2018年6月中旬
著者:アンテナハウス株式会社
販売形式:プリントオンデマンド版
サイズ:B5判 横組み
ページ数:126ページ
価格(税込):1,728円 6月18日アマゾンで発売になりました。
ISBN:978-4-900552-61-6
販売店:アマゾン(POD版)その他Web書店で発売予定

販売形式:PDF版(DRMなし)
ページ数:126ページ
価格(税込み):864円 6月8日発売
販売店:アンテナハウス・オンラインショップ(PDFのダウンロード)※PDF版のダウンロードは自社ストアのみです。




アウトライナー
PDFを解析して しおり・目次を自動生成


HTML on Word
WebページをWordで作る!

「Antenna House AHPDFXML 変換ライブラリ V2.0」の出力例 (フォント情報)

「Antenna House AHPDFXML 変換ライブラリ V2.0」は、PDFファイルの内部データを、XML(Extensible Markup Language:拡張可能なマークアップ言語)形式に変換するプログラムです。
このライブラリが出力するXML形式を「AHPDFXML形式」と呼びます。
PDF解析技術により文書構造を生成して、再利用に適したXMLデータを出力します。

今回は”フォント情報”がAHPDFXMLに出力される例を見てみます。
変換元PDFファイルのスクリーンショットです。
サンプルは、文字列”材料(3人分)”です。

ahpdfxml_pdf_0205

上記のPDFをAHPDFXML形式に変換したXMLの内容は次の通りです。

ドキュメントXMLの内容です。

文字は複数の ahp:run に分割されています。これは元の PDF 内で、文字の配置が分かれているためです。
どの文字も、スタイルXMLを参照するIDは ahp:s-id=s5 となっています。

スタイルXMLの内容です。

ahpdfxml_xml_0205b

  • フォント名 ahp:name=MS-Mincho
  • フォントサイズ ahp:size=18.000000
  • 強調表示 ahp:bold=true
  • 文字色は赤 ahp:color ahp:rgb=#f00000
  • 強調表示 ahp:bold=true
  • 下線は1本線の赤 ahp:border-b ahp:border-type=single ahp:width=1.000000 ahp:color ahp:rgb=#f00000

PDFファイルの中に含まれる文字やフォント情報を取り出すことができます。

XMLで表現することによって、データの扱いが容易になります。
XMLのメリットを最大限に活かしてPDFデータを活用できます。
弊社ウエブサイトより評価版の申し込みが可能です。是非ご評価ください。

製品に関するご質問は
sis@antenna.co.jp(SYSTEM担当)
または
oem@antenna.co.jp(OEM担当)
まで、お気軽にお問い合わせください。

評価版のお申込
評価版のお申込ページ

Webページ
https://www.antenna.co.jp/pdfxml/




アウトライナー
PDFを解析して しおり・目次を自動生成


HTML on Word
WebページをWordで作る!
Pages: Prev 1 2 3 4 5 6 7 8 9 10 ... 19 20 21 Next