« 2006年08月09日 | メイン | 2006年08月11日 »
2006年08月10日
リッチテキストPDF2の変換例
さて、リッチテキストPDF2で、どの位までPDFをうまく変換できるのだろうか?と疑問に持たれる方が多いと思います。
そこで、ひとつ変換例を紹介してみたいと思います。
このPDF文書を変換元として、Wordに変換してみましょう。
このPDF文書は、2005年10月31日 PDFからXMLへのデータ変換(3)で紹介しましたが、PDF帳票のデータを取り出してXMLに変換するプログラムを開発するための仕様書です。
オリジナルは、私が1年ほど前に書いた文書です。
このPDFを、リッチテキストPDF2を使って、Microsoft Wordに変換するにあたり、次の設定をしました。
(1)このPDFには、ヘッダとフッタがあります。そこで、昨日示しましたように、PDFのプレビュー機能を使用して、本文の範囲を設定しました。
(2)さらに、線画で書いた図を含んでいますので、線画の部分を「画像変換の指定」を機能を使って、画像変換領域に指定しました。(次の図)
そして、この設定条件を使用して、MicrosoftWordに変換した結果は次のとおりです。
いかがでしょうか?
ヘッダ、フッタもほぼ正しく変換されていますし、線画がEMF形式として変換できます。
ワープロ文書と違って、PDFファイルは再利用を意図して作成されていませんので、完全な変換はなかなか難しいものですが、この文書の場合は、完全とはいえないまでも、かなり元のワープロ文書に近くなっていることがお分かりいただけると思います。