日別アーカイブ: 2017年4月15日

マイクロソフトオフィスのファイルをPDFや画像に変換するには、どうしたら良い?

プログラマの情報共有サイトであるStackOverflowには、タイトルに掲げたような質問が頻繁に投稿されています。最近の投稿(3月6日)は、「オフィスファイルをイメージに変換するにはどうしたらよい?」というタイトルで、全部自力で(サードパーティのツールを使わないで)やりたい、という趣旨の質問が投稿されていました[1]

この人は、インターネットサーバーでオフィスのファイルをPDFか一般的な画像に変換して、ブラウザで表示したいようです。

サードパーティツールを使って良いなら、「アンテナハウスのSBC(サーバーベース・コンバータ)があるのにね」、と思いながら読みました。

やはり、これは難問のようです。ひとりの回答者が、それをするにはとうしなければならないのかを説明していました[2]。次に、概略を紹介しましょう。

「全部自分でやるなら次のようになる。
(1) まず、マイクロソフトのサイトにあるオフィス文書のドキュメント[2]を参照して、オフィスの文書形式に精通する。
(2) オフィスのファイルはzip形式なので、拡張子をzipに変更して解凍する。フォルダーを開くとXMLがあるので、そのXMLファイルを読む。
(3) 次にPDFまたはHTMLに徹底的に精通する必要がある。
(4) そして、オフィス文書形式をPDFまたはHTMLに変換する。ページレイアウトやマージンや順序を崩さないように。
これは結構大変な仕事で、全てを正確に出すのは本当に大変だ。
それでサードパーティのツールがあるんだけど、多くのツールはOpenOfficeを組み込んだりしているようだね[3]。でもときどきうまく変換できないケースもあるよ。」

まったく、彼の言うとおりです。

回答者(Corith Malinさん)のプロフィールを見たら、マイクロソフトのソフトウエア・エンジニアのようです。

どおりで、マイクロソフトのドキュメントにリンクがあるわけです。お陰で、マイクロソフトサイトでオフィスについて技術文書を公開しているサイトのありかが分かったのがこのスレッドを読んだ収穫です。

しかし、質問した人は、こんな大変なことを本当に自力でやるつもりなんでしょうかねぇ。

[1] How to convert office file to image
[2] Office File Formats
[3] サーバーベース・コンバータは、マイクロソフトオフィス、OpenOfficeにも依存していません。アンテナハウスが20年以上蓄積した独自技術で自力でレンダリングしています。オフィス文書の表示機能は「自在眼」にもあります。

もう少し詳しく書いた記事を作りました☞ Microsoft Office(マイクロソフト オフィス)のファイルを、プログラム開発者が自力でPDFや画像に変換するには、どうしたら良い?