タグ別アーカイブ: 変換

『Antenna House PDF Tool API』(PDF Tool API)をブラウザから呼び出して利用するデモ (2)

『Antenna House PDF Tool API』(PDF Tool API)は、PDFファイルの情報取得やPDFファイルの加工・編集を行うライブラリです。
PDFに関するさまざまな処理機能を搭載しています。
文書情報やページ数などの情報取得、ページの挿入や削除、透かしの挿入、セキュリティ設定などのファイル加工、ページコンテンツのテキストや画像の削除、画像の最適化(ダウンサンプリング)といったページ編集処理が可能です。

2018年 5月 9日から 3日間の日程で開催される「第 27 回ソフトウェア&アプリ開発展」(通称 SODEC ) にアンテナハウスは今年も出展致します。
この中で、『Antenna House PDF Tool API』(PDF Tool API)をブラウザから呼び出して利用するデモを展示しております。
サーバ側には、サーブレット・コンテナ(Tomcat)、PDF Tool API の Linux(64bit)版一式をインストールしてあります。
クライアント側は、ブラウザとなります。

処理モード

テキスト取得、テキスト追加、イメージ追加、墨消し追加の4つのモードから選択できます。
マウスをドラッグして、矩形を設定します。処理モード応じた領域が画面上に追加されます。
追加された領域は、拡大・縮小や移動が可能です。
追加された領域は、フォーカスを与えると、ツールバーが表示されます。ツールバーを使って設定が変更できます。

テキスト追加

テキスト追加で配置した領域は、テキスト、注釈、透かしとして設定できます。
配置した領域にフォーカスを設定すると、ツールバーが表示されます。このツールバーの左から2番目のコンボボックスで変更します。
設定画面のスクリーンショットと、設定を反映したPDFのスクリーンショットです。

  • テキストとして設定

    pdftoolt11PDF Tool API PtlParamWriteString, PtlContent.writeString を使用します。

    保存したPDFのプレビュー

    pdftoolt12

  • 注釈として設定

    pdftoolt21PDF Tool API PtlAnnotText, PtlAnnotPopup, PtlAnnots.append を使用します。

    保存したPDFのプレビュー

    pdftoolt22

  • 透かしとして設定

    pdftoolt31
    PDF Tool API PtlParamWaterMarkText, PtlPDFDocument.appendWaterMark を使用します。

    保存したPDFのプレビュー

    pdftoolt32

イメージ追加

イメージ追加で配置した領域は、イメージ、注釈、透かしとして設定できます。
配置した領域にフォーカスを設定すると、ツールバーが表示されます。このツールバーの左から2番目のコンボボックスで変更します。
設定画面のスクリーンショットと、設定を反映したPDFのスクリーンショットです。

  • イメージとして設定

    pdftooli11
    PDF Tool API PtlParamDrawImage, PtlContent.drawImage を使用します。

    保存したPDFのプレビュー

    pdftooli12

  • 注釈として設定

    pdftooli21

    PDF Tool API PtlParamDrawImage, PtlAnnotStamp, PtlAnnots.append を使用します。

    保存したPDFのプレビュー

    pdftooli22

  • 透かしとして設定

    pdftooli31
    PDF Tool API PtlParamWaterMarkImage, PtlPDFDocument.appendWaterMark を使用します。

    保存したPDFのプレビュー

    pdftooli32

製品に関するご質問は
sis@antenna.co.jp(SYSTEM担当)
または
oem@antenna.co.jp(OEM担当)
まで、お気軽にお問い合わせください。

評価版のお申込
評価版のお申込ページ

Webページ
http://www.antenna.co.jp/ptl/


『Antenna House PDF Tool API』(PDF Tool API)をブラウザから呼び出して利用するデモ (1)

『Antenna House PDF Tool API』(PDF Tool API)は、PDFファイルの情報取得やPDFファイルの加工・編集を行うライブラリです。PDFに関するさまざまな処理機能を搭載しています。
文書情報やページ数などの情報取得、ページの挿入や削除、透かしの挿入、セキュリティ設定などのファイル加工、ページコンテンツのテキストや画像の削除、画像の最適化(ダウンサンプリング)といったページ編集処理が可能です。

2018年 5月 9日から 3日間の日程で開催される「第 27 回ソフトウェア&アプリ開発展」(通称 SODEC ) にアンテナハウスは今年も出展致します。
この中で、『Antenna House PDF Tool API』(PDF Tool API)をブラウザから呼び出して利用するデモを展示しております。
サーバ側には、サーブレット・コンテナ(Tomcat)、PDF Tool API の Linux(64bit)版一式をインストールしてあります。
クライアント側は、ブラウザとなります。

トップ画面

pdftool

サイドバー

  • [PDFを選択]

    PDFファイルをサーバへアップロードした後、ページの内容を表示します。

  • [out] [in]

    表示倍率を変更します。

  • [prev] [next]

    表示ページを変更します。

  • 処理モード

    テキスト取得、テキスト追加、イメージ追加、墨消し追加の4つのモードから選択できます。

  • [PDFを保存]

    アップロードしたPDFと、編集内容から、PDF Tool API を使用して、新しくPDFを生成します。生成後にPDFのダウンロードとなります。

処理モード

テキスト取得、テキスト追加、イメージ追加、墨消し追加の4つのモードから選択できます。
マウスをドラッグして、矩形を設定します。処理モード応じた領域が画面上に追加されます。
追加された領域は、拡大・縮小や移動が可能です。
追加された領域は、フォーカスを与えると、ツールバーが表示されます。ツールバーを使って設定が変更できます。

  • テキスト取得

    選択した矩形内のテキストを取得します。

  • テキスト追加

  • 矩形内にテキストを追加します。
    フォントサイズ、文字色を変更できます。
    領域は、テキスト、注釈、透かしとして設定できます。
  • イメージ追加

  • 矩形内にイメージを追加します。
    イメージファイルとして、BMP、JPG、PNG が選択できます。
    領域は、イメージ、注釈、透かしとして設定できます。
  • 墨消し追加

  • 墨消しを設定した領域は、PDF内から文字データなどが消去され、代わりに塗りつぶしを書き込みます。

使用例

pdftool002

3つの領域を追加しています。上から順番に次のように設定しました。

  • テキスト領域

    テキストとして追加する。フォントサイズは24pt、文字色は赤。

  • イメージ領域

    イメージとして追加する。設定した画像はアンテナハウスのロゴ(PNG)。

  • 墨消し追加

    塗りつぶし色は青。

PDFを保存

PDF Tool API により、アップロードされているPDFと、3つの領域の内容を使って、新しくPDFを生成します。
ダウンロードされた PDF のスクリーンショットです。
文字列「あいうえお」(少しわかりにくいですが)、イメージ「アンテナハウスのロゴ」、「墨消し領域」が反映されています。
墨消しの設定により、領域内にある文字列「じゃがいも」から「好みで」までの文字情報はPDFから削除されます。

pdftool003

製品に関するご質問は
sis@antenna.co.jp(SYSTEM担当)
または
oem@antenna.co.jp(OEM担当)
まで、お気軽にお問い合わせください。

評価版のお申込
評価版のお申込ページ

Webページ
http://www.antenna.co.jp/ptl/


日本語ワープロのFDDデータ変換サービスのご紹介

日本語ワープロ専用機のデータを変換することができる弊社ソフトウェア『リッチテキスト・コンバータ20』『同 パーソナル』(以下、本製品)は 2016年12月20日をもって販売を終了させていただきました。長い間、開発・販売をしてきましたので、いまだに問い合わせをいただくことがあります。

様々な事情から、残された日本語ワープロのFDDデータを見る必要があるのだろうと思われますが、FDDの入手が年を追うごとに難しくなると同時に、Windows OSがFDDをサポートしなくなり、既存のユーザー様が本製品を継続してご利用いただくこと自体、厳しくなってきております。

本製品の販売は終了いたしましたが、変換サービスは現在も行っております。もし、お手元のPCで本製品が動作しなくなった、あるいは急に日本語ワープロのデータを変換したいといった場合、ぜひ変換サービスの利用をご検討ください。

なお、本サービスに使用しております機器の状況によっては、サービスの継続が困難になることも予想されます。その節はどうぞご容赦ください。


「Antenna House AHPDFXML 変換ライブラリ V2.0」の出力例 (フォント情報)

「Antenna House AHPDFXML 変換ライブラリ V2.0」は、PDFファイルの内部データを、XML(Extensible Markup Language:拡張可能なマークアップ言語)形式に変換するプログラムです。
このライブラリが出力するXML形式を「AHPDFXML形式」と呼びます。
PDF解析技術により文書構造を生成して、再利用に適したXMLデータを出力します。

今回は”フォント情報”がAHPDFXMLに出力される例を見てみます。
変換元PDFファイルのスクリーンショットです。
サンプルは、文字列”材料(3人分)”です。

ahpdfxml_pdf_0205

上記のPDFをAHPDFXML形式に変換したXMLの内容は次の通りです。

ドキュメントXMLの内容です。

文字は複数の ahp:run に分割されています。これは元の PDF 内で、文字の配置が分かれているためです。
どの文字も、スタイルXMLを参照するIDは ahp:s-id=s5 となっています。

スタイルXMLの内容です。

ahpdfxml_xml_0205b

  • フォント名 ahp:name=MS-Mincho
  • フォントサイズ ahp:size=18.000000
  • 強調表示 ahp:bold=true
  • 文字色は赤 ahp:color ahp:rgb=#f00000
  • 強調表示 ahp:bold=true
  • 下線は1本線の赤 ahp:border-b ahp:border-type=single ahp:width=1.000000 ahp:color ahp:rgb=#f00000

PDFファイルの中に含まれる文字やフォント情報を取り出すことができます。

XMLで表現することによって、データの扱いが容易になります。
XMLのメリットを最大限に活かしてPDFデータを活用できます。
弊社ウエブサイトより評価版の申し込みが可能です。是非ご評価ください。

製品に関するご質問は
sis@antenna.co.jp(SYSTEM担当)
または
oem@antenna.co.jp(OEM担当)
まで、お気軽にお問い合わせください。

評価版のお申込
評価版のお申込ページ

Webページ
http://www.antenna.co.jp/pdfxml/


「Antenna House AHPDFXML 変換ライブラリ V2.0」の出力例 (画像情報)

「Antenna House AHPDFXML 変換ライブラリ V2.0」は、PDFファイルの内部データを、
XML(Extensible Markup Language:拡張可能なマークアップ言語)形式に変換するプログラムです。
このライブラリが出力するXML形式を「AHPDFXML形式」と呼びます。
PDF解析技術により文書構造を生成して、再利用に適したXMLデータを出力します。

今回は”画像情報”がAHPDFXMLに出力される例を見てみます。
変換元PDFファイルのスクリーンショットです。
サンプルは、画像”野菜のかご盛り”です。

ahpdfxml_pdf_0202

上記のPDFをAHPDFXML形式に変換したXMLの内容は次の通りです。

ドキュメントXMLの内容です。

ahpdfxml_xml_0202a

  • イメージフレーム ahp:frame-type=image
  • 領域の座標 ahp:l ahp:r ahp:t ahp:b
  • カタログXMLを参照するID ahp:file-id=f1

カタログXMLの内容です。
ahpdfxml_xml_0202b

  • 外部ファイル名 ahp:href=pdf2tmp_0.bmp
  • 画像はBMP ahp:file-type=BMP
  • 参照されるID ahp:id=f1

AHPDFXMLの出力先フォルダのスクリーンショットです。
画像ファイル pdf2tmp_0.bmp が出力されているのがわかります。

ahpdfxml_ss_0202

PDFファイルの中に含まれる画像を取り出すことができます。

XMLで表現することによって、データの扱いが容易になります。
XMLのメリットを最大限に活かしてPDFデータを活用できます。
弊社ウエブサイトより評価版の申し込みが可能です。是非ご評価ください。

製品に関するご質問は
sis@antenna.co.jp(SYSTEM担当)
または
oem@antenna.co.jp(OEM担当)
まで、お気軽にお問い合わせください。

評価版のお申込
評価版のお申込ページ

Webページ
http://www.antenna.co.jp/pdfxml/


「Antenna House PDFXML 変換ライブラリ V2.0」メンテナンスリリースについて

2017年11月22日に、Antenna House PDFXML 変換ライブラリ V2.0 MR1 をリリースしました。

V2.0R1a と V2.0MR1 の相違点

  • 縦書き/横書き混在の CID フォントを使用している場合に、縦書き用記号から縦書きページを判断する処理を追加しました。
  • 縦線の結合処理において、余分な結合が発生する場合が有りましたので、調整しました。
  • 縦書きページに存在する横書きの数字をページ番号と判断する処理を修正しました。
  • セルの縦横結合の解析処理を改善しました。
  • セルのデータが一部出力されない不具合を修正しました。
  • 文字データが一部消えてしまう不具合に対応しました。
  • 画像ファイルの出力オプションに EMF を追加しました。
  • Antenna House PDFXML の仕様を修正しました。
Element/Attributes/Types 名前 区分 説明
Element ahp:font 追加 アトリビュート”rotation”を追加しました。
Element ahp:style 追加 アトリビュート”line-distance”を追加しました。

「Antenna House PDFXML 変換ライブラリ V2.0」は、PDF ファイルの内部データを、XML(Extensible Markup Language:拡張可能なマークアップ言語)形式に変換するプログラムです。 このライブラリが出力する XML 形式を「Antenna House PDFXML形式」と呼びます。
PDF 解析技術により文書構造を生成して、再利用に適した XML データを出力します。 XML で表現することによって、データの扱いが容易になります。
XML のメリットを最大限に活かして PDF データを活用できます。
弊社ウエブサイトより評価版の申し込みが可能です。是非ご評価ください。

製品に関するご質問は
sis@antenna.co.jp
または
oem@antenna.co.jp(OEM担当)
まで、お気軽にお問い合わせください。

評価版のお申込
評価版のお申込ページ

Webページ
http://www.antenna.co.jp/pdfxml/


「Antenna House AHPDFXML 変換ライブラリ V2.0」の出力例 (表)

「Antenna House AHPDFXML 変換ライブラリ V2.0」は、PDFファイルの内部データを、XML(Extensible Markup Language:拡張可能なマークアップ言語)形式に変換するプログラムです。
このライブラリが出力するXML形式を「AHPDFXML形式」と呼びます。
PDF解析技術により文書構造を生成して、再利用に適したXMLデータを出力します。

今回は”表”がAHPDFXMLに出力される例を見てみます。
変換元PDFのプレビューは次のような感じです。

ahpdfxml_pdf

上記のPDFをAHPDFXML形式に変換した結果です。
表(ahp:table)、行(ahp:row)、セル(ahp:cell)が出力されています。

ahpdfxml_xml

社内で試験用に使用している簡易ビューアの表示です。

表(ahp:table)、行(ahp:row)、セル(ahp:cell)座標をマーキングした表示です。

ahpdfxml_table

文字(ahp:run)の座標をマーキングした表示です。
文字列”ROOM”の文字”R”の文字のスタイルID(ahp:s-id)”s10″、Zオーダー(ahp:z-order)”457″です。

ahpdfxml_run

スタイル情報を、文字のスタイルID(ahp:s-id)”s10″で参照すると、文字属性がわかります。

ahpdfxml_style

AHPDFXMLに出力された表構造をデータベースに取り込むことにより、データのグループ化などがおこなえます。
AHPDFXMLに出力された表構造をCSV(表の項目値をカンマ区切りで表すテキストファイル)に落とすことにより、表計算ソフトなどで利用可能となります。

XMLで表現することによって、データの扱いが容易になります。
XMLのメリットを最大限に活かしてPDFデータを活用できます。
弊社ウエブサイトより評価版の申し込みが可能です。是非ご評価ください。

製品に関するご質問は
sis@antenna.co.jp(SYSTEM担当)
または
oem@antenna.co.jp(OEM担当)
まで、お気軽にお問い合わせください。

評価版のお申込
評価版のお申込ページ

Webページ
http://www.antenna.co.jp/pdfxml/


「Antenna House AHPDFXML 変換ライブラリ V2.0」の出力例 (文字)

「Antenna House AHPDFXML 変換ライブラリ V2.0」は、PDFファイルの内部データを、XML(Extensible Markup Language:拡張可能なマークアップ言語)形式に変換するプログラムです。
このライブラリが出力するXML形式を「AHPDFXML形式」と呼びます。
PDF解析技術により文書構造を生成して、再利用に適したXMLデータを出力します。

今回は”文字”がAHPDFXMLに出力される例を見てみます。
変換元PDFのプレビューは次のような感じです。
ahpdfxml_pdf_1030

上記のPDFをAHPDFXML形式に変換した結果です。
フレーム情報(ahp:frame)、段落(ahp:p)、行(ahp:line)、文字(ahp:run)が出力されています。

ahpdfxml_xml
社内で試験用に使用している簡易ビューアの表示です。

フレーム(ahp:frame)の座標をマーキングした表示です。

ahpdfxml_frame
文字(ahp:run)の座標をマーキングした表示です。

ahpdfxml_run1

文字(ahp:run)の座標をマーキングした拡大表示です。
文字列”カレー”の文字のスタイルID(ahp:s-id)”s8″、Zオーダー(ahp:z-order)”22″です。

ahpdfxml_run2

スタイル情報を、文字のスタイルID(ahp:s-id)”s8″で参照すると、文字属性がわかります。

ahpdfxml_style
AHPDFXMLに出力された文字情報には、位置情報が含まれます。位置情報を利用することで、任意の範囲に含まれる文字を取り出せます。

XMLで表現することによって、データの扱いが容易になります。
XMLのメリットを最大限に活かしてPDFデータを活用できます。
弊社ウエブサイトより評価版の申し込みが可能です。是非ご評価ください。

製品に関するご質問は
sis@antenna.co.jp(SYSTEM担当)
または
oem@antenna.co.jp(OEM担当)
まで、お気軽にお問い合わせください。

評価版のお申込
評価版のお申込ページ

Webページ
http://www.antenna.co.jp/pdfxml/


「Antenna House AHPDFXML 変換ライブラリ V2.0」の利用例

「Antenna House AHPDFXML 変換ライブラリ V2.0」は、PDFファイルの内部データを、XML(Extensible Markup Language:拡張可能なマークアップ言語)形式に変換するプログラムです。このライブラリが出力するXML形式を「AHPDFXML形式」と呼びます。PDF解析技術により文書構造を生成して、再利用に適したXMLデータを出力します。

「AHPDFXML形式」で表現された様々な情報から、必用な情報を読み取ることでPDFのデータを簡単に再利用できます。

  • 文字や画像の位置情報を利用することで、任意の範囲に含まれるデータを取り出せます。
    例えば、アンケートに使用したPDFの回答欄の文字列だけ取り出すことができます。
    例えば、特定の文字列や画像を含むPDFを探すことができます。
  • 表構造をデータベースに取り込むことにより、データのグループ化がおこなえます。
    PDFには表と言う概念はありませんが「AHPDFXML形式」は、表構造(行列及びセル)を生成します。
    これにより、文字としてでは無く、表としてデータを再利用できます。
    例えば、表構造をCSVに落とすことにより、表計算ソフトに取り出込めます。

XMLで表現することによって、データの扱いが容易になります。
XMLのメリットを最大限に活かしてPDFデータを活用できます。
弊社ウエブサイトより評価版の申し込みが可能です。是非ご評価ください。

製品に関するご質問は
sis@antenna.co.jp(SYSTEM担当)
または
oem@antenna.co.jp(OEM担当)
まで、お気軽にお問い合わせください。

評価版のお申込
評価版のお申込ページ

Webページ
http://www.antenna.co.jp/pdfxml/


「Antenna House AHPDFXML 変換ライブラリ V2.0」の概要

「Antenna House AHPDFXML 変換ライブラリ V2.0」は、PDFファイルの内部データを、XML(Extensible Markup Language:拡張可能なマークアップ言語)形式に変換するプログラムです。このライブラリが出力するXML形式を「AHPDFXML形式」と呼びます。PDF解析技術により文書構造を生成して、再利用に適したXMLデータを出力します。

PDFのデータは、文字、線、画像などが配置されているだけで、文字は見た目順に格納されているとは限らず、段落や表と言う概念もありません。本ライブラリでは、PDFのデータを単にXML化するだけで無く、文書構造を生成して、再利用に適したXMLデータを出力します。「AHPDFXML形式」として出力される主な情報は次の通りです。

  • 段落、行、パラグラフなどの文書情報を生成。
  • 線画情報から、水平/垂直の線分を抜き出して、表構造(行列及びセル)を生成。
  • 文字を見た目順に再配置してから出力。
  • 文字情報は、位置、フォント情報などを出力。
  • 画像情報は、位置、種別などを出力。
  • 画像本体は外部ファイルとして出力。

XMLで表現することによって、データの扱いが容易になります。
XMLのメリットを最大限に活かしてPDFデータを活用できます。
弊社ウエブサイトより評価版の申し込みが可能です。是非ご評価ください。

製品に関するご質問は
sis@antenna.co.jp(SYSTEM担当)
または
oem@antenna.co.jp(OEM担当)
まで、お気軽にお問い合わせください。

評価版のお申込
評価版のお申込ページ

Webページ
http://www.antenna.co.jp/pdfxml/