« 2006年09月03日 | メイン | 2006年09月05日 »
2006年09月04日
PDFからHTMLに変換(2)
昨日は、思わぬところで時間をとられてしまいましたが、今日は、他のPDFからHTMLへの変換ソフトとしてどのようなものがあるか、ピックアップしてみます。
BCL Technologies Magellan Desktop
Magellan Desktop Version 6.5
・Convert Documents to Web-Ready HTMLとあります。
・PDFを含む様々な文書をHTMLに変換できます。
・定価は129ドル(Webで99ドルで販売しています)
・日本語のサイトもあります。
30日間試用版がありますので、少し試してみます。
「リッチテキスト・コンバータ」の時と同じファイルを変換してみますと、日本語のPDFも問題なく変換できるようです。
変換結果をブラウザで表示した先頭の部分は、次の図のようになります。
このソフトの変換の特徴は、PDFのページをそのままHTMLでも1ページに変換することです。(既定値の場合。HTMLをひとつに結合するオプションも設定可能。)
HTMLをページ単位で分断し、1ページ毎をめくって行くようにナビゲーションします。このためjavascriptでフローティングするナビゲーションツールを作っています。このツールからサムネイルを表示することもできます。
できあがったHTMLは、次の図のようにPDFの1行毎に分断されていて、SPANタグで囲まれています。このためHTMLを再編集することはできません。
このHTML(本文の1ページ目のみ)をAnother HTML Lintで採点しますと、-369点になりました。うーーん。標準仕様などぜんぜん頭にないのでしょうね。
この製品の基本的な考え方は、PDFをブラウザでナビゲーションできる形式にするということにあり、HTMLにして再利用するという考え方ではないようですが、こういうやり方もあるということ。
投票をお願いいたします