« 2006年09月05日 | メイン | 2006年09月07日 »

2006年09月06日

PDFからHTMLに変換(3)

WebでPDFからHTML変換するソフトを調べていましたとこと、AdobeでPDFをHTMLに変換するサービスを行っているのに気が付きました。

Online conversion tools for Adobe PDF documents

1.PDFをe-Mailに添付して送信する方法
 テキストに変換するメール受付窓口と、HTMLに変換するメール受付窓口があります。

2.簡単なフォームでURLを送る方法
 Web上のPDFを指定して変換させることができます。

まず、2番についてためしてみました。Web上の英語のPDFを試しにアップしてみました。そうしますと、次のようなプログレス状態の表示になります。

20060905.PNG

しかし、数分かかったあと最後に、エラーになってしまってできません。4つのPDFファイルを変換してみましたがすべてエラーで、エラーの原因も通知してきません。

そこで、今度は、別のPDFをe-メールで送信してみましたところ、無事、HTML変換の結果が戻ってきました。
---ここから---
Thank you. Your document was successfully converted using the Adobe Acrobat Elements Server.

Document : WordML-Office.pdf
File Size : 367.9KB

Converted File : WordML-Office.zip
File Size : 49.8KB

---ここまで---
Acrobat Elements Server を使っているとあります。

変換精度を見てみますと、次のような状態です。
■オリジナルPDFファイルの1画面 
20060905-adobe-org.PNG

■上のページの変換結果(HTML)
20060905-adobe-html.PNG

画像は脱落してしまいます。

上の結果から見ますと、あまり精度は良くないことが分かりますね。

投票をお願いいたします

投稿者 koba : 08:00 | コメント (0) | トラックバック