« 2006年10月12日 | メイン | 2006年10月14日 »

2006年10月13日

PDFからWordへ 3つの変換ソフトを無慈悲に比較する (4)

さて、PDFからワープロ文書への変換について、実際にどの程度変換できるのか、もう少し違ったサンプルを取り上げて、そのもう少し比較検討してみたいと思います。

最初に、少し入り組んだPDFを取り上げて変換結果がどうなるかを見てみましょう。

○オリジナルは、画像、表、縦書き、横書きの文章が入り組んだPDFです。
20061013-1.PNG
オリジナルPDFをダウンロード (PDF)

○これを「リッチテキストPDF2」でWord文書に変換しました。
変換結果をWordで開いて、印刷プレビューしました。
20061013-2.PNG
変換後のWord文書をダウンロード

図、表、見出し、縦書き、横書き(2段組)ともほぼ完全に変換できていることがお分かりいただけると思います。

ひとつ、問題を挙げるとしますと、次の図のように縦書きの段落で一行毎にテキストボックスを作ってしまっているということでしょう。
20061013-3.PNG

これは早期に改善して欲しい点です。

ちなみに、この同じPDFを他社の製品でWordに変換しますと次のようになります。

「いきなりPDF to Data 2」で変換
変換結果をWordで開いて、印刷プレビューした画面
20061013-4.PNG
変換後のWord文書をダウンロード

「速攻!PDF to Data」で変換
変換結果をWordで開いて、印刷プレビューした画面
20061013-5.PNG
変換後のWord文書をダウンロード

どうもOCRを使う方式は、変換設定の仕方にもよるのかも知れませんが、カラーがあるとなんとなく認識精度が落ちるような印象を受けますが如何でしょうか。

投票をお願いいたします

投稿者 koba : 08:00 | コメント (0) | トラックバック