« PDFからHTMLに変換(1) | メイン | リッチテキストPDFの店頭デモのお知らせ »

2006年09月04日

PDFからHTMLに変換(2)

昨日は、思わぬところで時間をとられてしまいましたが、今日は、他のPDFからHTMLへの変換ソフトとしてどのようなものがあるか、ピックアップしてみます。

BCL Technologies Magellan Desktop
  Magellan Desktop Version 6.5
 ・Convert Documents to Web-Ready HTMLとあります。
 ・PDFを含む様々な文書をHTMLに変換できます。
 ・定価は129ドル(Webで99ドルで販売しています)
 ・日本語のサイトもあります。

 30日間試用版がありますので、少し試してみます。

 「リッチテキスト・コンバータ」の時と同じファイルを変換してみますと、日本語のPDFも問題なく変換できるようです。

 変換結果をブラウザで表示した先頭の部分は、次の図のようになります。
20060905-BCL.PNG

 このソフトの変換の特徴は、PDFのページをそのままHTMLでも1ページに変換することです。(既定値の場合。HTMLをひとつに結合するオプションも設定可能。)
 HTMLをページ単位で分断し、1ページ毎をめくって行くようにナビゲーションします。このためjavascriptでフローティングするナビゲーションツールを作っています。このツールからサムネイルを表示することもできます。

 できあがったHTMLは、次の図のようにPDFの1行毎に分断されていて、SPANタグで囲まれています。このためHTMLを再編集することはできません。
 
20060905-BCL1.PNG

 このHTML(本文の1ページ目のみ)をAnother HTML Lintで採点しますと、-369点になりました。うーーん。標準仕様などぜんぜん頭にないのでしょうね。

 この製品の基本的な考え方は、PDFをブラウザでナビゲーションできる形式にするということにあり、HTMLにして再利用するという考え方ではないようですが、こういうやり方もあるということ。

投稿者 koba : 2006年09月04日 08:00

トラックバック

このエントリーのトラックバックURL:
http://blog.antenna.co.jp/PDFTool/mt-tbng2.cgi/427

コメント

コメントしてください




保存しますか?