« 2006年08月09日 | メイン | 2006年08月11日 »

2006年08月10日

リッチテキストPDF2の変換例

さて、リッチテキストPDF2で、どの位までPDFをうまく変換できるのだろうか?と疑問に持たれる方が多いと思います。

そこで、ひとつ変換例を紹介してみたいと思います。

このPDF文書を変換元として、Wordに変換してみましょう。

このPDF文書は、2005年10月31日 PDFからXMLへのデータ変換(3)で紹介しましたが、PDF帳票のデータを取り出してXMLに変換するプログラムを開発するための仕様書です。

オリジナルは、私が1年ほど前に書いた文書です。

このPDFを、リッチテキストPDF2を使って、Microsoft Wordに変換するにあたり、次の設定をしました。

(1)このPDFには、ヘッダとフッタがあります。そこで、昨日示しましたように、PDFのプレビュー機能を使用して、本文の範囲を設定しました。
(2)さらに、線画で書いた図を含んでいますので、線画の部分を「画像変換の指定」を機能を使って、画像変換領域に指定しました。(次の図)
20060810.PNG

そして、この設定条件を使用して、MicrosoftWordに変換した結果は次のとおりです。

変換後のMicrosoft Word文書

いかがでしょうか?
ヘッダ、フッタもほぼ正しく変換されていますし、線画がEMF形式として変換できます。

ワープロ文書と違って、PDFファイルは再利用を意図して作成されていませんので、完全な変換はなかなか難しいものですが、この文書の場合は、完全とはいえないまでも、かなり元のワープロ文書に近くなっていることがお分かりいただけると思います。

投票をお願いいたします

投稿者 koba : 08:00 | コメント (0) | トラックバック