カテゴリー別アーカイブ: PDF Server

自動PDF変換・編集サーバーソリューション、AH PDF Server V3.1

AH PDF Server は、MS Office 文書など、さまざな文書、画像をサーバーサイドで PDF などに自動変換するサーバー製品です。 指定したフォルダに変換したい文書を、ドラッグ&ドロップすれば、自動で変換します。
オプションを使えば、逆に PDF や画像から MS Office 文書への変換、ブラウザを使った変換、CAD ファイルの変換も可能です。
詳しい紹介は、

を、ご覧ください。

以前のブログで、

「V3.0 を出してから、早いもので、すでに2年が経過しています。現在、約2年半ぶりのバージョンアップとして、V3.1 を出荷する計画を進めています。」

と書いておりましたが、おかげさまで、V3.1 を出荷することができました。
すでに、バージョンアップされたお客様からは、好評価をいただいております。

AH PDF Server V3.1 は、次のような機能強化を行っています。

  • コマンドラインの主要処理のマルチプロセス対応
    マルチプロセス対応によって、複数の処理を同時実行できるようになったため、より効率的な変換が可能となりました。
  • PDF Driver の更新
    最新のPDF Driver にしたことで、「PDF/X-1a」「PDF/X-3」 の出力も可能になりました。

AH PDF Server V3.1 の詳細については、
AH PDF Server V3.1 初版 公開
をご覧ください。

バージョンアップについては、
Antenna House PDF Server V3 バージョンアップについて
を、ご覧になり、弊社まで、お申し付けください。

アンテナハウスのシステム製品につきましては、事前に技術相談会を行っております。
お気軽にお問い合わせください。

詳しくは、
アンテナハウス システム製品技術相談会
をご覧の上、お申し込みください。


『PDF Server V3.1』マルチプロセスの効果

前回に引き続き、Antenna House PDF Server V3.1のご紹介です。

今回は処理時間の測定結果のご紹介です。
以下のような条件でコア数と並列させるプロセス数を変化させながら画像とOffice文書のPDF変換について処理時間を計測しました。

計測環境

仮想環境:
VMware Workstation 9.0.4
OS: Windows Server 2008 R2 Standard Service Pack 1(64bit)
CPU: 1~4core
MEM: 2GB
Office: Office 2010 Standard
ホスト環境:
OS: Windows 7 Professional Service Pack 1 (64bit)
Intel Core i5-3470 3.2GHz (4core)
MEM: 8GB
元データ:
全50ファイルで以下が混在

  • 画像ファイル(TIF/BMP/PNG/JPEG/JPEG200)
  • Microsoft Office文書(Word/Excel)

計測結果

以下がその測定結果を表にしたもので、列が並列稼働させたプロセスの数、行が仮想環境で設定したコア数で、計測値の単位は秒になっています。
これらはあくまでも『仮想環境』上でのことですので、特にコア数の変化と測定結果の関連は実機ではことなる可能性もありますが、おおよその関連は測れるのではないかと思います

コア数 プロセス数
1 2 3 4 5 6
1 162.5 139.9 141.7 137.0 137.9 136.1
2 163.9 78.5 74.3 74.0 73.1 73.5
3 166.5 76.6 62.1 59.8 59.0 58.8
4 164.7 76.5 60.7 54.7 51.9 52.5

コア数ごとの並列プロセス数と処理時間の関係

コア数ごとの並列プロセス数と処理時間の関係

今回の結果からは次のようなことが見えてきます。

  • 並列プロセス数がコア数内の場合、並列数を増やすほど処理時間が短くなり、今回の4コアの環境では最大で約3倍の高速化を実現している。
  • プロセスを2つ稼働させた状態が一番効率よ高速化でき、2コア以上の環境では約2倍の高速化となってるものの、以降コア数を増やすごとにその効果は減少していく傾向にある。
  • 並列プロセス数がコア数を超えてしまうと以降はほぼ頭打になる。

また、この結果には含んでいませんが、これらの計測中にタスクマネージャでCPU利用率をモニタしたところ、並列プロセス数がコア数以上となると、CPU利用率が100%になる頻度が高くなっていました。

これらからは、並列稼働させるプロセスの目安としては、2~コア数以下の値がお勧めと言えそうです。

なお、今回の結果は仮想環境のみでしたが、後日、4コアのCPUを搭載した実機と、参考として8コアの仮想環境にて同様な測定を行う予定で、結果は次の製品ページ上で公開予定ですので、よろしければこちらも御覧ください。

製品ページ:

製品お問合せ:システム営業グループ
TEL:03-5829-9021  e-mail:sis@antenna.co.jp


『PDF Server V3.1』リリース!

すでに先月のお話になりますが、10月22日にPDF Serverのマイナーバージョンアップ版である、『PDF Server V3.1』の初版を無事リリースいたしました。
V3.0のリリースから2年数か月。今回はマイナーバージョンアップのため、追加された機能は少々少なく感じられるかもしれませんが、一部のお客様にはお待たせしました!となる「コマンドラインのマルチプロセス対応」が目玉となっています。

コマンドラインのマルチプロセス対応

コマンドラインの一部機能には並列稼働が困難なものが含まれるため、今回の対応は以下の機能に限定されてはいますが、いずれも重要な機能をチョイスしています。

  • 画像ファイルのPDF変換
  • Microsoft Office文書のPDF変換
  • PDFファイルの画像変換(出力)
  • PDFファイルの結合
  • CADファイルのPDF変換(要:CAD変換オプション)

まだ、あまり多くのファイルで試せてはいませんのでサンプル数が少ないのですが、4コアのプロセッサーを使用した検証では、上記の変換にかかる時間を1/3程度まで軽減できています。

PDFドライバの更新

マルチプロセス対応の一環としてPDF Serverと連携する『PDF Driver』を従来のV5から最新版となるV6に更新しています。
それにともない、従来のPDF/Aに加えてPDF/X(PDF/X-1a、PDF/X-3)の出力が可能になっています。
ただし、PDFファイルをPDF/Xのまま出力するにはPDF/A同様に…

blog_dialog_setting

[変換設定]-[入力設定]-[PDF Driver設定]から「出力PDFファイルに出力設定のPDF設定を適用しない。」を指定して、PDF生成後のPDF編集を行わないように指定する必要がありますのでご注意ください。

製品ページ:

製品お問合せ:システム営業グループ
TEL:03-5829-9021  e-mail:sis@antenna.co.jp


『AH PDF Server V3』のOCR機能について

 「AH PDF Server V3」ではPDFに変換する時にOCR(Optical Character Recognition:光学文字認識)を行う事が出来ます。OCRについてはこのブログでも時々出てきますので、詳細については省略しますが、時々サポートにも質問が寄せられる事がありますので、その辺について触れたいと思います。

 OCR機能と言うのは平たく言えば画像の中の文字を認識してそれをテキストとして作成するPDF上にレイアウトします。そのため、「AH PDF Server V3」では入力ファイルが画像ファイルもしくはPDFファイルの時にOCRを行う設定の場合には処理を実行します。当然、入力ファイルがテキストファイルやオフィスファイルの時にはOCRを行う設定になっていても無視します。

 OCR自体は画像認識処理なので、画像ファイルの場合には特に問題ありませんが、PDFファイルが対象の場合は少し事情が違います。ひとくちに「PDF」と言っても中身が全部同じとは限らないからです。

 「AH PDF Server V3」ではOCRの対象となるPDFファイルは1ページに画像が1枚だけ存在するPDFとなり、これが基本的な考え方です。少し難しい表現をしましたが、ハッキリ言えば画像をスキャナでスキャンして出力されたPDFファイルを対象としています。ただし、最近の複合機などで出力される「高圧縮されたPDF」の場合はスキャンされたPDFでもOCRの対象ではありません。

 変換設定の「OCR処理設定」で「すべてのPDFファイルでOCRテキスト付きPDFを作成する」のチェックがオフの場合、スキャンされたPDF以外では「OCR対象外」として無視されます(エラーにはなりません)。

 しかし、デフォルトでは「すべてのPDFファイルでOCRテキスト付きPDFを作成する」のチェックはオンになっています。この設定の場合は入力ファイル全てがOCR処理の対象となります。極端な話をすれば、テキストで構成されたPDFファイルもOCR対象にしてしまいます。

 この場合はどういう処理を行うのかと言えば、PDFを1ページ単位で画像に変換してからOCR処理を実行して再びPDFに変換します。これをすべてのPDFを対象に(上記の「1ページに画像が1枚だけ存在するPDF」も同様に)実行します。見た目には同じPDFですが、中身はまったく違ったPDFになってしまうため、以下のようなお問い合わせが時々寄せられる事があります。

 ・PDFファイルをOCR処理したらファイルサイズが大きくなった
 ・埋め込んであったフォント情報が無くなってしまった

 ファイルサイズが大きくなるのは一度画像にしてしまうからなのですが、例えばテキストだけのPDFだと数キロバイトが百数十キロバイト程度になります。本来対象となる「1ページに画像が1枚だけ存在するPDF」以外のPDFは軒並みファイルサイズはかなり大きくなります。また、フォント情報も一度画像に変換してしまうために全て失われてしまいます。

 「AH PDF Server V3」でPDFファイルを処理する場合、OCR処理に関しては基本的には「すべてのPDFファイルでOCRテキスト付きPDFを作成する」のチェックをオフにしておく事をおすすめします。そうすればテキストがすでに存在してフォント情報なども埋め込まれているPDFに対して不用意にOCR処理を実行してしまう事もありませんから。

 デフォルト状態がオンなのはV2.0の頃からの名残なのですが、設定する時には一度どんなPDFを処理するかを確認した上で設定を行うようにして頂ければ幸いです。

——-

AH PDF Serverについて、詳細情報は製品ページをご確認ください。
また、評価版もWebページからダウンロード可能です。ぜひお試しください!
評価版お申込みページ

製品についてのお問い合わせ:
アンテナハウス株式会社システム営業までどうぞ。
TEL:03-5829-9021 e-mail:sis@antenna.co.jp


「AH PDF Server V3」次期改訂版(3)機能拡張コマンドプログラム

「AH PDF Server V3」次期改訂版について、最終回です。

 「AH PDF Server V3」のフォルダ監視変換では実装しにくい機能を個別のコマンドプログラムとして提供するのが「機能拡張コマンドプログラム」になります。実際には一部のお客様には提供した機能なのですが、次期改訂版からすべてのお客様に提供する事にしました。ただし、対応するのはプロフェッショナル版とコマンド版のみとなります。

 前々回にも少し触れましたが、フォルダ監視変換では設定は基本的に全てのファイルで同じ設定を使う事になります。そのため、例えばセキュリティ解除では同じパスワードなら問題ないですが、ファイルによって異なるパスワードの場合は対応出来ません。そういった機能で要望があったものを「AH PDF Server V3」の本体設定とは別に個別のコマンドプログラムとして対応し、機能拡張として提供します。

 主にWebアプリケーションや他システムから「AH PDF Server V3」のコマンドプログラムを呼び出して利用している(利用を考えている)お客様に対しての機能提供となりますが、提供する拡張機能については少し説明します。

【セキュリティ解除】

 「AH PDF Server V3」で処理するPDFにはセキュリティが掛っていないことが前提になっています。本来、セキュリティを掛けたPDFファイルというものは処理される事を前提にしていないため、このような仕様にしています。

 この考え方は基本的には変わりは無いのですが、それでも組織内に限って言えばセキュリティを外したい場面はあるようです。そのために今回、機能拡張として提供を決めました。セキュリティを解除するにはパスワードを知ってる必要があるので、パスワードが分からないPDFのセキュリティを解除する事は当然出来ません。

【ページ削除】

 PDFファイルの特定のページ、もしくはページの範囲を削除する事が出来ます。これにより、不要なページを省く事が可能です。

【ページ抽出】

 ページ削除とは逆に、必要なページのみを抽出します。指定方法が個別のページや範囲などを組み合わせて指定できるので(例えば「2,4,5-9,23」と指定すると2ページ、4ページ、5ページから9ページ、23ページを抽出する事が出来ます)ページ削除よりも柔軟に使う事が出来ます。

【ファイル添付】

 PDFファイルに任意のファイルを添付する事が出来ます。1ファイルだけならコマンドにパラメータを記述するだけで添付できますし、複数の場合は添付したいファイルのパスを複数記述したテキストファイルを指定する事により複数ファイルを一度に添付できます。

 いずれの機能拡張コマンドプログラムも元ファイルの削除や変更を行う事は無く、新たなPDFファイルを生成します。

 これらのコマンドは次期改訂版がリリースされたら評価版でも確認して頂けます。お役立て頂ければ幸いです。


「AH PDF Server V3」次期改訂版(2)アドイン変換

 「AH PDF Server V3」の次期改訂版で追加される「Word」と「Excel」のアドイン変換について少し触れたいと思います。

 アドイン変換自体は前回も書きましたが「PDF Driver」の機能の1つで、アドインを登録するとMicrosoft Office(Word/Excel/PowerPoint)の各編集画面に「アドイン」メニューが追加されてアンテナハウスのアドインボタン(設定と変換)が表示されます。そこで設定したりPDFに変換したりする事によって通常のPDF変換(印刷によるPDF変換)では出来ない事を可能にしています。

 具体的な設定画面は以下のようになっています。

「Word」の変換設定画面

「Word」の変換設定画面

「Excel」の変換設定画面

「Excel」の変換設定画面

 実際にアドイン登録された状態でMicrosoft Office(Word/Excel)を開き、アドインメニュー内の設定のアイコンをクリックして表示してみると分かると思いますが、ほぼ同じ設定が可能になっています。

 要望として多いものは「Word」の「見出し」などのスタイルをしおりにする事と、「ハイパーリンク」をPDFでも有効にする事です。この2つは割合定期的に要望が寄せられます。また、PDFに変換した時に、オリジナルのファイルと少しレイアウトなどが変わってしまうケースがあるのですが、お客様によってはオリジナルのファイルを添付する事によってそういう事態を回避したいという要望もあります。

 注意点としては従来の変換の設定とアドイン設定は排他設定になっている事です。要するに「従来の設定での変換」か「アドインを使った変換」かのいずれかになります。これに関しては変換方法が異なるため、どうしても両立出来ません。

 いずれにしても「Word」や「Excel」の変換が多いお客様にとっては便利な機能追加だと思います。

PDF Server 製品ページ
●製品お問い合わせ先 システム製品営業
 e-mail:sis@antenna.co.jp
TEL:03-5829-9021


「AH PDF Server V3」次期改訂版について

 「AH PDF Server V3」は現在、改訂版リリースに向けて作業を行っています。リリース時期は8月末から9月にかけてを予定しています。

 今回の改訂版はお客様から要望があった機能を少し追加しました。バージョンアップというほどの大きな機能追加ではありませんが、意外に「あれば嬉しい」機能の追加だと思います。
 そして、今回の機能追加は以下の2点となります。

 ・「Word」「Excel」ファイルのアドイン変換
 ・機能拡張コマンドプログラム

 「Word」と「Excel」のアドイン変換というのは、PDF Driverの機能の1つに「Word」や「Excel」の編集画面上で「アドイン」メニュー内に表示されるアドインボタンを使用してPDFに変換する機能があるのですが、それを「AH PDF Server V3」上から利用して変換するものです。

 この機能を用いると、例えば「Word」なら「見出し」などのスタイルをしおりに変換したり、ハイパーリンクを有効にしたり、目次をリンクに変換したりする事が出来ます。

 機能詳細についてはこちら(http://www.antenna.co.jp/pdv/function04.html)です。

 機能拡張コマンドプログラムと言うのは、特定の機能だけをコマンドラインプログラムにしたものになります。具体的には「PDFのセキュリティ解除」「PDFのページ削除」「PDFのページ追加」「添付ファイルの追加」になります。

 「AH PDF Server V3」のフォルダ監視による変換では定型の設定による変換が出来ますが、これらの機能はなかなか定型の設定では対応出来ない機能であり、ファイルによって設定内容が異なる事が当たり前の機能と言えます。

 ただ、「AH PDF Server V3」のコマンドライン機能を使ってWebアプリケーションや他システムから呼び出すような形でご利用の場合、変換のたびに設定を変更する事が可能なため、「AH PDF Server V3」の機能を拡張するために「コマンドラインプログラム」として提供する事にしました。

 「機能拡張コマンドプログラム」はプロフェッショナル版とコマンド版のみのご提供となりますのでご注意下さい。

 次期改訂版で追加する2つの機能については2回に分けてもう少し説明したいと思います。

PDF Server 製品ページ

製品についてお問い合わせ
e-mail:sis@antenna.co.jp
TEL:03-5829-9021


「AH PDF Server V3」に無い機能?

 「AH PDF Server V3」のホームページには、お客様の許可を頂いてお買い上げ頂いた「AH PDF Server V3」をどのような形で実際の業務にご利用になっているかをご紹介する「事例紹介」ページがあります。

 こちらのページを見て頂ければ実際の使用例のため、「AH PDF Server V3」をお考えの方には参考になると思います。

 ところでお気づきになられた方もひょっとしていらっしゃるかも知れませんが、事例紹介の中にはどこを探しても見つからない機能がいくつか列挙されています。具体的には「PDFのセキュリティ解除」「PDFのページ削除」「PDFへファイルの添付」の3つです。

 「AH PDF Server V3」は機能的にはフォルダ監視変換がメインです。入力フォルダ内に変換したいファイルをコピーして出力フォルダに変換後のファイルを保存します。これはどういう事かと言えば、変換するための設定が常に「同じ」という事が前提となります。これに対して先に挙げた3つの機能は基本的に「同じ」設定ではない事が普通です。

 しかし最近は「Webインタフェース」からのPDF変換が増えてきています。そのため、「AH PDF Server」ではV2.3からコマンドライン変換もサポートするようになりました。コマンドライン変換の利点は任意のタイミングで任意の設定で変換を行う事が出来るようになる事です。
 「PDFのセキュリティ解除」「PDFのページ削除」「PDFへファイルの添付」の3つの機能はフォルダ監視変換機能に組み込めないため、それぞれ独立したコマンドラインプログラムとして存在しています。利用するにはお客様でプログラムなりスクリプトを組むなどする必要があります。

 現在は評価版でも提供をしていないのですが(いずれ組み込みたいとは考えていますが)、ご希望があれば提供する事は可能です。評価版のお申し込みの項目にある「お問い合わせ・ご質問など」に「利用(評価)してみたい」と書いて頂ければ対応させて頂きます。

 まずは評価版からお試しください。

 AH PDF Server V3 評価版お申込み
 AH PDF Server V3 製品ページ


DocuWorksとPDFについて

 お客様から「DocuWorks形式のファイルをPDFに変換したい」というご相談を時々頂くことがあります。聞いてみると保存してある大量のDocuWorksファイルをPDFに変換したいとの考えている方が大半のようです。

 「DocuWorks」とはご存知の方も多いと思いますが、富士ゼロックス社製の電子文書と電子化した紙文書を一元管理するオフィス向けドキュメント・ハンドリング・ソフトウェアの事です。使い勝手の話をすればPDFとよく似た規格と言えます。見るだけならビューアーも用意されていますので本当にPDFとよく似ています。

 「DocuWorks」を導入するきっかけの大半はご利用になっている複合機の兼ね合いが大きいようです。富士ゼロックス社製の複合機でスキャンしたデータなどは基本的に「DocuWorks」形式になります。そのため、その流れで「DocuWorks」で資料をアーカイブされている事も多いです。

 しかし、他社からデータをもらったり逆に他社へデータを送ったりする場合には大抵の場合はPDFだと言われます。そのため、送るときはPDFに変換し、もらった時はDocuWorks形式に変換する手間が発生します。

 最近ではタブレットやスマートフォンでもドキュメントを閲覧する機会が増えてきました。もちろん、「DocuWorks」もiPhoneやiPad、Android用の閲覧ソフトはあります。 しかし、DropBoxなどのクラウドサービスを使った場合、PDFはたいていの場合は開くと表示できますが、「DocuWorks」のファイルは表示されない事の方が多いです。

 「DocuWorks」と「PDF」を比べてどちらが良いかは使う方次第なので何とも言えませんが、汎用性と言う部分についてはPDFの方に軍配が上がるようです。

 「AH PDF Server V3」では「アプリケーション変換」という機能を使えば「DocuWorsk」のファイルを変換する事が出来ます。「DocuWorks」もしくはビューアーは必要ですが、一度設定してフォルダ監視変換を使用すればあとは入力フォルダに「DocuWorks」ファイルをコピーするだけで自動で変換を行う事が出来て便利です。

 どのように行うかは資料(DocuWorks_Convert.pdf)をご用意しましたので、一度評価版と共にお試し下さい。

 AH PDF Server V3 評価版お申込みページ
AH PDF Server 製品ページ


サービスかコマンドラインか

おはようございます。
今日は、PDF Server の動かし方について、いろいろ考えてみます。

2つの変換方法

 「PDF Server V3」でPDFに変換する場合、2つの方法があります。

「フォルダ監視」変換
Windowsサービスを使用して定期的にフォルダを監視して変換を行う
「コマンドライン」変換
ユーザーが任意のタイミングで変換を行う事が出来る

どちらの場合も変換を行うコアの部分は全く同じなので(当然ですが)、出力されるファイルはいずれの方法でも設定が同じなら同じものとなります。

なぜ2つの変換方法を提供するのか

 それは、お互いのデメリットをなるべく解消できる方法として一番効果的だからです。

それそれの変換について、特徴を記載します。

「フォルダ監視」変換の特徴

動作の仕組みとメリット

 入出力フォルダと変換設定を行ってサービスを起動すればあとは設定に従って停止されるまで処理を行います。

設定さえしてしまえば、後は入力フォルダにファイルをコピーすればそのうち出力フォルダにPDFが作成されます。

デメリット

取り扱いが容易な反面、変換が終わるのがいつになるのか分からないデメリットがあります。

特に入力フォルダを複数設定した場合(「PDF Server V3」ではタスク設定と言います)、監視時間のサイクルとファイルの変換頻度によっては数十分やひどい時になると1日経っても変換されない可能性もあります。

もっともこの辺は運用前に設定をチューニングすれば、ある程度は解消されるので極端な事はあまりありませんが、それでもコピーした順番と変換する順番が同じとは限らないため、変換までの時間や他システムとの連携に関してはやや余裕が必要になると言えます。

「コマンドライン」変換の特徴

メリットとデメリット

 逆に「コマンドライン」変換はユーザー側で実行しないと変換が始まらないため、変換までの応答性がかなり良いです。

その代わり使用するにはプログラムやスクリプトを作成する必要があり、利用するにはそれなりの知識が必要となります。

 また、「フォルダ監視」変換は基本的に決まった設定でしか変換出来ませんが、「コマンドライン」変換ではユーザー側がプログラムで動的に変換設定を作成する事によりその時々に合った設定で変換を行う事が出来ます(変換設定の仕様はユーザー様には無償で公開しています)。

 「PDF Server V3」はほとんどのお客様が何らかのシステムと連携して利用されており、それぞれのニーズに合わせて「フォルダ監視」変換か「コマンドライン」変換を選択されています。どちらでも対応できるのは「PDF Server V3」の大きな特長です。

 評価版ではほぼすべての機能が制限なく利用できますので、その利便性も一度試してもらえればと思います。

AH PDF Server V3 製品ページ

AH PDF Server 評価版お申込みページ


Pages: Prev 1 2 3 4 5 Next