「Antenna House AHPDFXML 変換ライブラリ V2.0」は、PDFファイルの内部データを、XML(Extensible Markup Language:拡張可能なマークアップ言語)形式に変換するプログラムです。このライブラリが出力するXML形式を「AHPDFXML形式」と呼びます。PDF解析技術により文書構造を生成して、再利用に適したXMLデータを出力します。
「AHPDFXML形式」で表現された様々な情報から、必用な情報を読み取ることでPDFのデータを簡単に再利用できます。
- 文字や画像の位置情報を利用することで、任意の範囲に含まれるデータを取り出せます。
例えば、アンケートに使用したPDFの回答欄の文字列だけ取り出すことができます。
例えば、特定の文字列や画像を含むPDFを探すことができます。 - 表構造をデータベースに取り込むことにより、データのグループ化がおこなえます。
PDFには表と言う概念はありませんが「AHPDFXML形式」は、表構造(行列及びセル)を生成します。
これにより、文字としてでは無く、表としてデータを再利用できます。
例えば、表構造をCSVに落とすことにより、表計算ソフトに取り出込めます。
XMLで表現することによって、データの扱いが容易になります。
XMLのメリットを最大限に活かしてPDFデータを活用できます。
弊社ウエブサイトより評価版の申し込みが可能です。是非ご評価ください。
製品に関するご質問は
sis@antenna.co.jp(SYSTEM担当)
または
oem@antenna.co.jp(OEM担当)
まで、お気軽にお問い合わせください。
評価版のお申込
評価版のお申込ページ
Webページ
https://www.antenna.co.jp/pdfxml/