カテゴリー別アーカイブ: システム製品

PDF Tool API でカスタムプロパティ

今年の暑さは人だけでなく植物にもつらいものがあります。庭木も葉先が茶色になり悲鳴をあげています。地植えとはいえさすがに水やりをやらなくてはならない状態です。とはいっても庭土は乾燥しきっていて少々の水やりでは焼け石に水状態です。
猫の額ほどの庭ですが、20~30分かけて垂れ流し状態で水をやっています。

さて、PDFは文書情報として「タイトル」「作成者」「サブタイトル」「キーワード」の設定ができますが、 違う名前で独自のものを設定したいということもあります。そこで、PDF Tool APIではカスタムプロパティとして、任意の名前と値を設定できるようにしました。
設定したカスタムプロパティはAdobe Readerでも確認することができます。

PDFToolAPI
●製品詳細ページ
『Antenna House PDF Tool API 』


『Antenna House PDF Tool API』(PDF Tool API)でPDFに含まれる画像を保存する

『Antenna House PDF Tool API』(PDF Tool API)は、PDFファイルの情報取得やPDFファイルの加工・編集を行うライブラリです。
PDFに関するさまざまな処理機能を搭載しています。
文書情報やページ数などの情報取得、ページの挿入や削除、透かしの挿入、セキュリティ設定などのファイル加工、ページコンテンツのテキストや画像の削除、画像の最適化(ダウンサンプリング)といったページ編集処理が可能です。

今回は『Antenna House PDF Tool API』(PDF Tool API)を使用して、PDFの中に含まれる、すべての画像を、外部ファイルとして保存してみたいと思います。

Javaサンプルコード

Javaサンプルコード(SearchImageAndExport)のダウンロード (zip)

関数 subSearchImageAndExport にて、画像を検索して、ファイルとして保存しています。

入力サンプルPDF

sample

出力サンプル画像(1)


出力サンプル画像01

出力サンプル画像(2)


出力サンプル画像02

PDFに含まれる、すべての画像を、簡単に取り出すことが可能です。
PDF Tool API には、このほかにも便利な機能が沢山あります。ぜひご検討ください。

製品に関するご質問は
sis@antenna.co.jp(SYSTEM担当)
または
oem@antenna.co.jp(OEM担当)
まで、お気軽にお問い合わせください。

評価版のお申込
評価版のお申込ページ

Webページ
http://www.antenna.co.jp/ptl/


『Antenna House PDF Tool API』(PDF Tool API)で墨消しを自動化してみる

『Antenna House PDF Tool API』(PDF Tool API)は、PDFファイルの情報取得やPDFファイルの加工・編集を行うライブラリです。
PDFに関するさまざまな処理機能を搭載しています。
文書情報やページ数などの情報取得、ページの挿入や削除、透かしの挿入、セキュリティ設定などのファイル加工、ページコンテンツのテキストや画像の削除、画像の最適化(ダウンサンプリング)といったページ編集処理が可能です。

今回は『Antenna House PDF Tool API』(PDF Tool API)を使用して、PDFの文字列に対して、墨消しの自動化を行ってみたいと思います。
墨消しの対象となる文字列を検索、文字列に対して墨消しを設定、最後に文字情報が消されているのかチェックします。

Javaサンプルコード

Javaサンプルコード(SearchTextAndSetMask)のダウンロード(ZIP)

関数 subSearchTextAndSetMask にて、文字列検索と墨消しの設定をしています。
その後、関数 subSearchText にて、再度文字列検索を行い、文字情報が消えたかチェックしています。

入力サンプルPDF

pdftool.6.0.sample

出力サンプルPDF(文字列「Antenna」を指定して墨消し)

入力サンプルPDF

出力サンプルPDF(文字列「PDF」を指定して墨消し)

pdftool.6.0.case2

Javaサンプルコードで、墨消しの設定は、わずか7行ほどです。
大量のPDFであっても、bat的に呼び出すだけで、一括で墨消しを設定することも可能です。
PDF Tool API には、このほかにも便利な機能が沢山あります。ぜひご検討ください。

製品に関するご質問は
sis@antenna.co.jp(SYSTEM担当)
または
oem@antenna.co.jp(OEM担当)
まで、お気軽にお問い合わせください。

評価版のお申込
評価版のお申込ページ

Webページ
https://www.antenna.co.jp/ptl/


『PDF Driver V7.5』の組み込み版

PDF Driver V7.5  は、システム製品として販売をしておりますが、 組み込み用ライセンスとしてのご提供を準備中です。

V7.5 の機能として

  • 出力ファイル名の連番付けができるようになりました。
    出力先にすでに同名のファイル名を持つ PDF ファイルが存在する場合に、これまでは、上書き保存を行なうか、処理を中止するかの2択でしたが、ファイル名の末尾に連番を付与して別ファイルとして保存するオプションを用意しました。
  • グレースケール、モノクロ変換
    カラーの画像やテキストをグレースケールまたはモノクロに変換することが可能になります。
  • 設定ファイル名の埋め込み
    PDF 出力に使用した印刷設定の設定ファイル名を文書情報内に独自のキーで埋め込みできます。PDF Driver で作成したPDFがどのような設定で作成したものか PDF で確認できるというものです。

既存の組み込み用ライセンスのお客様へのご案内は、8月後半を予定しております。
もう少々お待ちください。


『PDF Tool API V6.0』 の機能紹介

PDF Tool API V6.0 では、コマンドライン版と、ライブラリ版の 2 タイプをご用意致します。

PDF の分割、結合、セキュリティ設定など基本的な機能は、コマンドライン版で行うことができますが、より高度な操作をさせたい場合は、ライブラリ版にて実現可能です。

ライブラリ版では、テキスト取得機能が強化されます。
矩形内の文字列を取得する機能、文字列検索機能など、これまで同様の処理を行う場合は、PDF Viewer SDK を使用しなければできませんでしたが、PDF Tool API V6.0 のみで可能になります。
文字列検索機能の実装により、PDF に書かれている文字列にて PDF を自動仕訳するような用途にご利用頂けます。

その他、フォントの埋め込み機能など、これまで出来なかった機能を『PDF Tool API V6.0』で対応致します。

ライブラリの概要

PDF の活用に関しては、製品ナビゲータ  を公開しております。
こちらに掲載が無い活用方法などございましたら弊社までお気軽にご相談ください。


『Antenna House PDF Tool API V6.0 コマンドライン』をリリースしました!!

『Antenna House PDF Tool API V6.0 コマンドライン』は、PDFファイルの加工や編集を行うライブラリ『Antenna House PDF Tool API』の新バージョンです。V6.0では、「コマンドライン」と「ライブラリ」の2製品があります。

「コマンドライン」は、PDF Tool API V5.0に同梱されていたコマンドラインを機能強化し、単独製品化しました。「ライブラリ」製品は、ライブラリとコマンドラインで構成されています。

「ライブラリ」は、近日公開予定です。

PDF Tool API V6

<製品の特長>

  • 対応プラットフォーム
    → Windows版、Linux版の2種類のプラットフォームに対応しています。
  • 32bit / 64bit ネイティブ対応
    → 32bit、6bitそれぞれにネイティブ対応しています。
    V6.0 Linux版においては、64bitのみの提供となります。
  • マルチプロセスでの利用
    → 複数のプロセスで同時実行が可能です。
  • 処理対象のPDFファイル
    → PDF Tool APIの処理対象となるPDFは、PDFバージョン「1.7」までのファイルです。特定のPDF生成エンジンやPDF生成ライブラリで作成されたPDFに限定されません。PDFリファレンスの仕様に準拠したPDFファイルであれば処理対象となります。
  • コマンドラインの特長
    → コマンドラインは、コマンドとオプションを指定して実行するしくみです。機能は限定されますが、PHP、Phython、Rubyなど、実行ファイルの呼び出しと制御ができるプログラム言語からも簡単に利用できます。

製品に関する詳しい情報は、PDF Tool APIページ を御覧ください。

PDF Tool APIを組み込んだブラウザベースでPDFを編集するデモサイトをお公開しております。詳しくは、PDF Tool API デモ を御覧ください。

〒103-0004
東京都中央区東日本橋2-1-6 東日本橋藤和ビル5F
アンテナハウス株式会社
◆ご購入に関するお問い合わせ(祝日を除く月~金曜日9:30~18:00)
TEL : 03-5829-9021
FAX : 03-5829-9023
E-mail: sis@antenna.co.jp
URL : https://www.antenna.co.jp/


『PDF Cook Book 簡易版』を順次公開中

『PDF Cook Book 簡易版』は、PDFの料理本『PDF CookBook』を簡潔にまとめたものです。展示会で弊社ブースにお立ち寄りしていただいた方やご訪問させていただいた方々へお配りしていましたが、現在はPDF Tool APIのWebページにて項目毎に順次公開しております。

PDF CookBook 簡易版ページ

PDFの料理本『PDF CookBook』は、PDF Tool APIで実現できる機能を目的別にわかりやすく解説しております。
また、すぐにでもご使用できるようにJavaでのソースコードも記載しています。

自社システム、及びアプリケーションへPDF加工・編集機能を追加したい場合や、エンドユーザー様へのご提案時に参考にしてください。

PDF Tool API V6

「Antenna House PDF Tool API」(PDF Tool API)は、PDFファイルの情報取得やPDFファイルの加工・編集を行うライブラリです。

PDF Tool APIに関する詳しい情報は、PDF Tool API ページ を御覧ください。

PDF CookBookに関する詳しい情報は、PDF CookBookのご紹介 を御覧ください。

PDF Tool APIを組み込んだブラウザベースでPDFを編集するデモサイトをお公開しております。詳しくは、PDF Tool API デモ を御覧ください。

〒103-0004
東京都中央区東日本橋2-1-6 東日本橋藤和ビル5F
アンテナハウス株式会社
◆ご購入に関するお問い合わせ(祝日を除く月~金曜日9:30~18:00)
TEL : 03-5829-9021
FAX : 03-5829-9023
E-mail: sis@antenna.co.jp
URL : https://www.antenna.co.jp/


TextPorter におまかせ その3

■ 全文検索の結果はテキスト情報だけではなく、元の文書も閲覧したいのですが、ファイル形式がバラバラでして。

『TextPorter』 は、さまざまなアプリケーションのファイルから、作成したアプリケーションがなくてもテキストを抽出することができます。
その抽出したテキストを、全文検索システムで検索できるようにしておくことで、目的の文書をすばやく探し出せるのです。

と、ドヤ顔で言ってはみましたが、確かに作成されている文書はテキスト情報だけではありません。挿絵の画像やグラフ・表は、文書の附帯情報として必須のものです。
やはり元の情報を過不足無く閲覧できるのがベストですね。
(次第に声が小さくなっていく)

テキスト以外の情報を切り出して再配置する。できないことはありませんが、手間が掛かる。
元ファイルをそのままリンクしても、各アプリケーションが無いと開けません。
ファイルを丸ごと画像や PDF に変換するにしても、やはり作成元のアプリケーションが必要。
アプリケーションに依存せずにテキストを抽出したのだから、閲覧ファイルも同じように作れたら・・・

「となると、やっぱり あれ の出番ですね」

『Office Server Document Converter(OSDC) にお任せください!』

Office Server Document Converter は、作成元のアプリケーションもプリンタドライバも必要とせずにドキュメントを変換できます。

Office Server Document Converter によって、文書からサムネイル画像を生成することで、全文検索システムで検索した文書の見分けも簡単にできるようになります。
目的の文書をすばやく探し出して、そのサムネイルをみて、実際の文書を引っ張り出せるようにするわけです。
また、検索結果と PDF をリンクすることで、元の文書の情報を過不足無く閲覧することができます。

システムのイメージは、
Office Server Document Converter 活用例にある
サムネイルサーバ
を発展させたものです。

『アンテナハウス にお任せください!』

Office Server Document Converter に関する詳しい情報は、
https://www.antenna.co.jp/sbc/
を、ご覧ください。

評価版もご用意しております。
Office Server Document Converter 評価版のお申し込み
から、お申し込みください。

<< TextPorter におまかせ その2


TextPorter におまかせ その2

■ 社内の文書ファイルをアーカイブとして利用したいのですが、どうすればよいでしょうか?

とある展示会場で、弊社ブース前でチラシを手に取る来場客に「お声掛け」をした際の返答でした。

「検索システムを作成してはどうですか。うちでは扱っていませんが・・・・」
えーっと、これでは話が終わってしまう。無理矢理こちらの土俵に引き込まなくては。

「データを XML 化すればですね、検索結果を web で閲覧できるし、任意のレイアウトで組版して再配布も・・・・」
いかん、「XML」と「組版」の時点で遠い目になってしまっている。

「XML 構造の設計と XSLT の開発は当方で請負いますが、タグ付けの作業は・・・」
逆効果じゃないか、非日常空間から呼び戻さなくては。

「そのためには、テキストの抽出が必要になります。」
お、やっと言葉が通じたか。

「文書ファイルからテキスト情報を抽出する機能は,検索システムや文書管理システムには必須機能です。TextPorter は、さまざまなアプリケーションのファイルからテキストを抽出する、サーバ組込用テキスト抽出エンジンです。」
突然、カタログ的説明口調になっている。

「TextPorter で文書からテキストを抽出して、全文検索システムで検索できるようにしておくことで、目的の文書をすばやく探し出せます。」
XML の件は無かったことにしました。

『TextPorter にお任せください!!』

その後、この話がどう展開したか。それは、また別のお話し。

「TextPorter」 は、次のようなシステム、または汎用製品に組み込まれており採用実績があります。

  • 文書管理ソフトウェア製品に組み込み
  • 全文検索エンジンと共にグループウェアに組み込み
  • 企業内文書管理システムに組み込み
  • 電子メール・サーバ製品に組み込み
  • インターネット情報検索アプリケーションに組み込み
  • イントラネット・テキスト・マイニング・サーバに組み込み
  • セキュリティ管理製品に組み込み

Microsoft Office, PDF など主要なアプリケーション・ファイルを識別し、作成したアプリケーションがなくても、ファイルからテキストを抽出可能です。
しかも、ファイルの拡張子ではなく、ファイル内部の情報に基づいて識別しますので、正確な判別が可能となります。

対応しているファイル形式は、 「抽出対象ファイル形式」https://www.antenna.co.jp/axx/function02.html
をご覧ください。

「TextPorter」に関する詳しい情報は、製品ページ
https://www.antenna.co.jp/axx/
を、ぜひ、ご覧ください。

評価版もご用意しています。
評価版のお申し込み
https://www.antenna.co.jp/axx/trial.html
から、お申し込みください。

<< TextPorter におまかせ その1           TextPorter におまかせ その3 >>


TextPorter におまかせ その1

■ 様々な文書ファイルからテキスト部分を抽出できる製品はありますか?

重要文書が突然消えたかと思うとひょっこり現れたりと、ドキュメントの「神隠し」が横行しているからというわけではないでしょうが、紙文書の電子化で業務の効率化と省スペース化するサービス、まだまだ需要は尽きないようです。

「今頃紙の電子化なんて」と思われた方、文書が全て電子化できているからと安心してはいませんか。
では、過去に作成された大量のドキュメント・ファイル、どのように活用していますか。
多種多様なアプリケーション、異なるバージョンでファイル形式の百花繚乱!
いざドキュメントを開こうとしてもアプリが見つからず、サーバの中で塩漬けになっていては、紙文書を倉庫に積み上げているのと変わりません。

~ドキュメント、役に立たなきゃただのゴミ~

  1. 各種アプリケーションのデータを、編集可能な形式にコンバート
  2. 各種アプリケーションのデータを、一括でPDFや画像に変換
  3. PDFから各種アプリケーションソフトのデータにコンバート

レガシーデータの再利用には様々な方法があります。
いずれの場合も、アンテナハウスの製品を利用すれば簡単に実現できますが、今回は書面の再現・再利用ではなく、ドキュメントからテキストを抽出する方法をご提案します。

体裁ではなく中身(テキスト)が重要!
データベース化し、手軽に検索して閲覧するのが目的ならば、大量のファイルから高速にテキストを抽出できる方法が鍵になりますね。
しかし、多種多様なファイル形式とバージョンが混在していて、ファイル形式別に仕分けするのは至難の業・・・

『TextPorter にお任せください!!』

「TextPorter」 は、さまざまなアプリケーションのファイルからテキストを抽出する、クラウドコンピューティング時代のサーバ組込用テキスト抽出エンジンです。
Microsoft Office, PDF など主要なアプリケーション・ファイルを識別し、作成したアプリケーションがなくても、ファイルからテキストを抽出可能です。
しかも、ファイルの拡張子ではなく、ファイル内部の情報に基づいて識別しますので、正確な判別が可能となります。
対応しているファイル形式は、 「抽出対象ファイル形式」 をご覧ください。昔懐かしい(年代が知れます)各種ワープロ文書にも対応しています。

「TextPorter」 は、対応ファイルの多さなどが評価され、ウェブサービス、パブリッククラウド、プライベートクラウドなどで、検索エンジン、ウイルス対策ソフト、企業機密の漏洩を防ぐソフトなどに利用されています。

「TextPorter」 に関する詳しい情報は、製品ページ
https://www.antenna.co.jp/axx/
を、ぜひ、ご覧ください。

評価版もご用意しています。
評価版のお申し込み
https://www.antenna.co.jp/axx/trial.html
から、お申し込みください。

TextPorter におまかせ その2 >>


Pages: 1 2 3 4 5 6 7 8 9 10 ... 12 13 14 Next