カテゴリー別アーカイブ: 使用方法・利用例

「AH PDF Server V3」次期改訂版(2)アドイン変換

 「AH PDF Server V3」の次期改訂版で追加される「Word」と「Excel」のアドイン変換について少し触れたいと思います。

 アドイン変換自体は前回も書きましたが「PDF Driver」の機能の1つで、アドインを登録するとMicrosoft Office(Word/Excel/PowerPoint)の各編集画面に「アドイン」メニューが追加されてアンテナハウスのアドインボタン(設定と変換)が表示されます。そこで設定したりPDFに変換したりする事によって通常のPDF変換(印刷によるPDF変換)では出来ない事を可能にしています。

 具体的な設定画面は以下のようになっています。

「Word」の変換設定画面

「Word」の変換設定画面

「Excel」の変換設定画面

「Excel」の変換設定画面

 実際にアドイン登録された状態でMicrosoft Office(Word/Excel)を開き、アドインメニュー内の設定のアイコンをクリックして表示してみると分かると思いますが、ほぼ同じ設定が可能になっています。

 要望として多いものは「Word」の「見出し」などのスタイルをしおりにする事と、「ハイパーリンク」をPDFでも有効にする事です。この2つは割合定期的に要望が寄せられます。また、PDFに変換した時に、オリジナルのファイルと少しレイアウトなどが変わってしまうケースがあるのですが、お客様によってはオリジナルのファイルを添付する事によってそういう事態を回避したいという要望もあります。

 注意点としては従来の変換の設定とアドイン設定は排他設定になっている事です。要するに「従来の設定での変換」か「アドインを使った変換」かのいずれかになります。これに関しては変換方法が異なるため、どうしても両立出来ません。

 いずれにしても「Word」や「Excel」の変換が多いお客様にとっては便利な機能追加だと思います。

PDF Server 製品ページ
●製品お問い合わせ先 システム製品営業
 e-mail:sis@antenna.co.jp
TEL:03-5829-9021


「AH PDF Server V3」次期改訂版について

 「AH PDF Server V3」は現在、改訂版リリースに向けて作業を行っています。リリース時期は8月末から9月にかけてを予定しています。

 今回の改訂版はお客様から要望があった機能を少し追加しました。バージョンアップというほどの大きな機能追加ではありませんが、意外に「あれば嬉しい」機能の追加だと思います。
 そして、今回の機能追加は以下の2点となります。

 ・「Word」「Excel」ファイルのアドイン変換
 ・機能拡張コマンドプログラム

 「Word」と「Excel」のアドイン変換というのは、PDF Driverの機能の1つに「Word」や「Excel」の編集画面上で「アドイン」メニュー内に表示されるアドインボタンを使用してPDFに変換する機能があるのですが、それを「AH PDF Server V3」上から利用して変換するものです。

 この機能を用いると、例えば「Word」なら「見出し」などのスタイルをしおりに変換したり、ハイパーリンクを有効にしたり、目次をリンクに変換したりする事が出来ます。

 機能詳細についてはこちら(http://www.antenna.co.jp/pdv/function04.html)です。

 機能拡張コマンドプログラムと言うのは、特定の機能だけをコマンドラインプログラムにしたものになります。具体的には「PDFのセキュリティ解除」「PDFのページ削除」「PDFのページ追加」「添付ファイルの追加」になります。

 「AH PDF Server V3」のフォルダ監視による変換では定型の設定による変換が出来ますが、これらの機能はなかなか定型の設定では対応出来ない機能であり、ファイルによって設定内容が異なる事が当たり前の機能と言えます。

 ただ、「AH PDF Server V3」のコマンドライン機能を使ってWebアプリケーションや他システムから呼び出すような形でご利用の場合、変換のたびに設定を変更する事が可能なため、「AH PDF Server V3」の機能を拡張するために「コマンドラインプログラム」として提供する事にしました。

 「機能拡張コマンドプログラム」はプロフェッショナル版とコマンド版のみのご提供となりますのでご注意下さい。

 次期改訂版で追加する2つの機能については2回に分けてもう少し説明したいと思います。

PDF Server 製品ページ

製品についてお問い合わせ
e-mail:sis@antenna.co.jp
TEL:03-5829-9021


PDF Viewer SDK で PDFテキスト抽出

Antenna House PDF Viewer SDKはPDF表示のためのSDKですが、表示以外にも PDFファイル内のテキストを抽出することができます。今回はこの機能をご紹介したいと思います。

テキスト抽出に利用するのはSDKの PDFViewerAPI です。
開発言語は C/C++ が利用できます。

矩形内テキスト取得(getTextInRect)

ページとそのページの矩形を指定してテキストを抽出します。

 例)矩形 (4535, 3798)-(7933, 4535) → テキスト “UVWXYZ”

矩形内テキスト取得画面

 座標系は、原点は左上、x軸は右方向、y軸は下方向に増加します。
 長さの単位はTWIPで1/20ポイント、1/1440インチに相当します。
 TWIP は「Twentieth of an Inch Point」の略だそうです。

 1インチは 25.4mm ですので、
 1 mm = 1440/25.4 TWIP ≒ 56.69 TWIP の計算になります。

 例1 の矩形は、mm 単位では (80.0, 67.0) – (141.0, 80.0) になります。

文字単位でのテキストおよび座標の抽出(getPageTextString/getPageTextRegion)

ページと、そのページ内での文字の開始位置と終了位置を指定して、テキスト(getPageTextString)もしくはテキスト領域(getPageTextRegion)を取得します。

  • 例)開始位置 20、終了位置 26 → テキスト “UVWXYZ”
  • 例)開始位置 0、終了位置 1  → テキスト “A”
文字単位でのテキストおよび座標の抽出 (getPageTextString/getPageTextRegion)

文字単位でのテキストおよび座標の抽出
(getPageTextString/getPageTextRegion)

(開始位置, 終了位置)=(0, 1), (1, 2)のように進めることで、PDF内の文字との文字領域を順に取得することもできます。

なお、テキストの順序は PDFのページに文字コードが現れる順になります。
PDFによっては必ずしも見た目の順と一致しない場合がありますので、注意が必要です。

以上、PDF表示以外での利用方法のご紹介でした。
 
評価版のお申し込み:
http://www.antenna.co.jp/oem/ViewerSDK/trial.html
お問い合わせ:
SDKはOEM販売となります。OEMご相談窓口へお問い合わせください。


Pages: Prev 1 2 3 4 5 6 7 8 9 10