« 2007年03月11日 | メイン | 2007年03月13日 »

2007年03月12日

Softinterface "ConvertDoc"

先日、PDFからWord、Excelへの変換ソフトのことをお話しました。

2007年03月08日PDFからWordとExcelに変換するソフト

そこで、Softinterfaceの"ConvertDoc"について評価してみて欲しいというコメントをいただきました。Softinterfaceは1999年から変換ソフトやファイル比較ソフト製品を作って販売しているようです。以前にも何回か社内的に変換ソフトの評価対象としてチェックしたような記憶があります。最近では、Microsoft OfficeからPDFに変換する「サーバベース・コンバータ」の英語版を出す際に競合製品として調べたと思います。Microsoft Officeを使わずに、Office文書をPDFに変換するソフトは、世界的にみても比較的種類が少ないのですが、その競争相手の一つとして評価しました。その時の記憶では、はっきり申し上げて、スカタンなソフトと思いましたけれども。

PDFからOfficeへの変換ソフトとしては、評価したことはありません。これは要チェックです。早速、調べてみましょう。

まず、ConvertDocの特徴は、かなりいろいろな方向へのファイル形式変換ができるということです。そういう意味では、弊社の製品で言いますと、「リッチテキスト・コンバータ」に近いと思います。

ConvertDocでは、PDFからWord文書、HTML、テキストに変換できます。なお、Excelに変換する機能はないようです。先日のコメントでも、価格が高いとありましたが、価格は次のようになっています。

デスクトップ基本ライセンス料金が、$499ドルです。但し、これでは、PDFからWord変換できません。PDFからWordへの変換(厳密にはPDFからRTFへの変換)をプラスしますと$549.95です。これだけですと、将来のアップデートはなしです。さらに将来1年間のアップデートを追加しますと、$679.90となります。念のために申し添えますと、アップデートとはバグ・フィックス版の提供です。バージョンアップは、アップグレードと言います。で、バージョン・ヒストリを見ますと、”COM interface was broken since v3.83”なんてのがあります。6ヶ月もCOMインターフェイスが動かなかったようです。アップデートなしだと修正版をもらえないとしたら、結構悲惨ではないでしょうか?

さて、ダウンロードして試してみました。まず、良い点は、最初にメニューとしてかなりいろいろな言語を選択できることです。日本語のメニューも選ぶことができます。これは素晴らしいですね。変換テストですが、以前に、「2006年10月01日PDFからWordへ 3つの変換ソフトを無慈悲に比較する(1)」で使いました、「敦賀市物品等競争入札参加資格審査申請書提出要領(建設工事を除く。)」を試してみました。

ConvertDocでは、詳細設定ダイヤログで、Word文書の作成方法を次の3つから選ぶことができます。
20070312.PNG
1.テキストボックスを使って正確に配置する
2.テキストフロー
3.スペースとタブでレイアウトを維持

この中で、1の方式は、テキストボックスを使いまくってPDFのレイアウトをWordで再現する方式です。「いきなりPDF to Data」や「速攻!PDF to Data」などのOCR生まれのソフトが行っている方式です。「PDFからWordへ 3つの変換ソフトを無慈悲に比較する」の時にも批判しましたが、私にはWord文書を作るのにテキストボックスを使いまくる理由がまったく理解できません。こんな変換に価値はないと思います。

2のテキストフローは、テキストを取り出す機能のようです。但し、RTFになりますので、Word文書としてのページ書式は付加されます。表の罫線などは消えてしまいます。良い点は、結構、変換速度が速いということしょうか。

3.スペースとタブでレイアウトを維持が一番評価に値するように思います。変換してみますと結構高速です。但し、出来上がったファイルサイズが異常に大きいですね。

オリジナルPDF: 153KB
ConvertDoc(RTF): 8950KB(約60倍)
(ご参考:「リッチテキストPDF2」では、470KBのDOCファイルになります。)

さて、変換結果をチェックしてみます。
用紙サイズは、A4、上下左右余白はそれぞれ、18.6mm、21.2mm、13.5mm、23.6mmに設定されています。また、ヘッダ・フッタ領域を12.7mmに設定。余白をきちんと取っていますし、ヘッダ・フッタ領域を取っているところは良いと思います。

また、1~2ページにテキストボックスが一つもなく、インデントとタブで文字の桁位置をセットしています。このあたりはやるな、という感じですが、但し、細かく見ますと文字の位置が正しくセットされずに、余分な改行が入ったりしてずれてしまっています。この結果、次図のようにPDFの1ページ目がWordでは2ページになってしまっています。
20070312-1.PNG
それからConvertDocの最大の問題点は表でしょう。全ての表の罫線が画像として変換されています。表のテキストが表のセル内の文字として認識されずに、本文テキストとなっていて、画像に変換した罫線を上に貼り付けています。結局、このソフトではPDFの表を表として扱うことができていないということになります。表を扱いたい方にはまったくお勧めできません。

そんなことで、結局、このソフトはテキストだけのPDFをWordに変換するなら使えますが、それ以外の用途ではあまり使えないと思います。

変換結果のWord文書をアップしようと思いましたが、ZIPで圧縮してもファイルが大きすぎでエラーになってしまいました。
※評価したConvertDocはVersion4.04です。

投票をお願いいたします

投稿者 koba : 08:00 | コメント (0) | トラックバック