カテゴリー別アーカイブ: Office Server Document Converter

Officeが変われば、Office Server Document Converterも変わる!

~OSDCv7.0改訂1版(MR1)リリース予告~

前回のOSDCV7.0販売開始のご案内から、早いもので3ヶ月が経ちました。
皆様いかがお過ごしでしょうか。

ところで、昨年秋にリリースされたOffice2019を、お使いになられていますでしょうか。
そう言えばそんなニュースがあったようだが、Office365でサブスクリプションの契約だから気にもしていなかった。
とか、Office2010の延長サポートギリギリまで粘るからまだまだ。とか、Windows10の無償バージョンアップし忘れまして・・・。などとおっしゃる方の、何と多いことか。

興味深い機能や多数の改善が行われているようなので是非とも、などというOffice2019の紹介・宣伝記事は専門サイトに任せておきまして、今回もOffice Server Document Converter(OSDC)の近況報告をさせていただきます。

Officeが変われば、Office Server Document Converterも変わる!

Office2019の新機能に対応したOSDCv7.0改訂1版を、2月27日にリリース致します。
Office2019に対応することと共に、Office365の現状の機能に追いつくことが目的です。厳密にはOffice365とOffice2019は同一ではありませんが、何しろOffice365は足が速い。
とりあえず、節目の一里塚を立てたという感じです。

Officeの新バージョン対応となると、かつては賑々しくこちらもバージョンアップで応えたものですが、今回は地味に改訂版なのはなぜかと言いますと。
手抜き?いえいえ。
実は、OSDCが元々持っていた機能の応用で、Officeの新機能を使ったドキュメントを変換再現できてしまいまして、流石OSDCの機能の奥深さと先見の明と関係者一堂ドヤ顔なのでありました。

とはいえ、「対応」の陰には少なからず「制限事項」もあるので、継続的な改善は必須と考えています(真顔)。

ということで、またもリリース前の予告広告。
主な対応機能は、以下の通りです。

  • 描画:ペン、デジタルインクの図形への変換(Word,Excel,PowerPoint)
  • 3Dモデル(Word,Excel,PowerPoint)
  • アイコンとSVG の挿入(Word,Excel,PowerPoint)
  • LaTeX の数式のサポート(Word)

詳細については、順次ご報告をさせていただきます。
OSDCv7.0改訂1版、2019年2月27日にリリース!
乞うご期待!

Office Server Document Converter に関する詳しい情報は、
https://www.antenna.co.jp/sbc/ を、ご覧ください。

評価版もご用意しております。
Office Server Document Converter 評価版のお申し込み
から、お申し込みください。

アンテナハウスではPDFの生成、読み込み、編集、表示ライブラリーを自社開発ライブラリーとして保有しています。こうした基本技術や製品をお客様のシステムに組み込む受託の開発も行っています。お気軽に、お問い合わせ下さい。

OEM


『Office Server Document Converter』OpenXMLSDKでマージしたdocx(Word)文書の対応

現在のOffice Server Document Converter(OSDC)(V7.0)はマージされたWord文書に対応していません。ユーザからの要望がありマージされた文書への対応を検討しています。

Word文書内のwordフォルダはいくつかのxml文書で構成されています。

document.xml 本文
fontTable.xml フォント
settings.xml セッティング
style.xml スタイル
footer1.xml フッタ
header1.xml ヘッダ
footnote.xml 脚注
endnote.xml 文末脚注
numbering.xml 箇条書き設定

などです。
OpenXMLSDKでマージした文書にはこのwordフォルダ内にマージされたWord文書がそのまま入っています。

afchunk1.docx

このdocxファイルの参照は本文中にある<w:altChunk>から行います。

 <w:altChunk r:id="AltChunkId0"/>

ファイル_rels/document.xml.relsからr:idに対応する文書を得ます。

 <Relationship Type="http://schemas.openxmlformats.org/officeDocument/2006/relationships/aFChunk" Target="/word/afchunk1.docx" Id="AltChunkId0" />

これで、マージされたWord文書(Target=”/word/afchunk1.docx”)を得ることができます。

このファイルはWord文書そのものです。

<w:altChunk>というエレメントはBlock要素です。

 <xsd:group name="EG_BlockLevelElts">
    <xsd:choice>
      <xsd:group ref="EG_BlockLevelChunkElts" minOccurs="0" maxOccurs="unbounded"/>
      <xsd:element name="altChunk" type="CT_AltChunk" minOccurs="0" maxOccurs="unbounded"/>
    </xsd:choice>
  </xsd:group>

Block要素としては<w:p><w:tbl>などがあります。
これらの要素と同じように処理すればマージした文書になるはずです。

<w:p/><w:p/><w:p/>
<w:altChunk/> ここにマージ文書を挿入する
<w:p/><w:p/><w:p/>

document.xml内は

<w:document>
 <w:body>
  <w:p/>
  <w:p/>
  <w:tbl/>
  ...
  <w:p/>
 </w:body>
</w:document>

のように並んでいます。
マージするとき、 <w:document><w:body>の処理を行えば、内部は外側の文書と同じBlock要素として処理できます。問題は、あくまで別文書として処理しなければいけない。外側と、内部文書では参照するファイルが異なります。style.xmlなどは独立した設定になるはずです。

OSDCでは <w:altChunk>で指定されたWordファイルから新しいdocumentクラスを作成する。
documentクラスからページ作成を継続する。
documentクラスの処理が終了したら親のdocumentの<w:altChunk>に戻り処理を継続する。
このような実装を行っています。

今後も要望などを検討しよい製品にしていきます。


海外出展情報 その2

Tekom 2018

The European Association for Technical Communication  (欧州技術通信協会)は、11月13日から15日までドイツのシュトゥットガルトで開催される TCWorld aka Tekom  という年次の会議を主催しました。Tekom Europe は、世界最大のテクニカルライターの専門家向けの協会です。

Tekom では、PDF が今日使用されている最も一般的なドキュメントフォーマットであり、PDF を中心としたアンテナハウスの製品には常に大きな関心が寄せられています。 アンテナハウスは、AH Formatter V6.6Office Server Document Converter V7.0PDFXML変換ライブラリV2.0web Interface for AH FormatterWeb Interface for OSDC Regression Testing System V1.4 などの製品を紹介しました。

Tekom の参加者のあいだでは、XSL-FO は最適な組版ストラテジーとして選択されていますが、またページ組版としてのCSSにも非常に興味が持たれています。 AH Formatter V6.6 では、CSS の機能が改善されました。また、Formatter と CSS の併用に興味がある開発者のために、弊社ウェブサイトで CSS ページ組版入門 第4版 を公開しています。またプリントオンデマンド版がAmazon.co.jp から販売開始されました。

アンテナハウス(海外サイト)
http://www.antennahouse.com/

http://rainbowpdf.com/


海外出展情報 その1

DITA Europe

昨年の11月5日から6日にかけて、アンテナハウスはオランダのロッテルダムで開催された CMS/DITA Europe でスポンサーとして参加しました。 第14回目にあたる Content Management Strategies/DITA Europe であり、2日間にわたって DITA に関する貴重な情報がふんだんに提供されました。会議では、参加者は Technology Test Kitchen と呼ばれるセッションで、発表者が新しい DITA ツールまたは CMS の使用方法を説明した後に、一緒に実地経験を積むことができました。

アンテナハウスは、DITA Open Toolkit 用の Antenna House PDF5-ML プラグイン を使用して、1つの DITA 文書に複数の言語をフォーマットする方法についてのデモを Technology Test Kitchen で発表しました。 PDF5-ML プラグインは AH Formatter と連携して動作するように設計されており、DITA Open Toolkit が提供するデフォルトの PDF プラグインよりも使いやすく、変更や管理が簡単で、尚且つパワフルです。 参加者は、PDF5-ML プラグインに大きな関心を示し、多言語ドキュメントを修正して PDF 出力を生成することがどれほど迅速かつ簡単であるかを体験しました。

セッションの合間には、参加者と席者と出展会社が集い友好を深めるための休憩室が設けられていました この会議の出展会社の多くはアンテナハウスのパートナーであり、また参加者の多くは AH Formatter のユーザでしたので、彼らと再会し、ソフトウェアの新機能を紹介し、パートナーシップを強化すべく今後のプランについて話し合う絶好の機会であったと思います。

アンテナハウス(海外サイト)
http://www.antennahouse.com/

http://rainbowpdf.com/


『Office Server Document Converter V7.0』

『Office Server Document Converter V7.0』は、Microsoft Office Word/Excel/PowerPointのデータを サーバーサイドでPDFや、画像に変換することができる変換ライブラリです。

V7.0では、以下の機能を実装強化しました。

  • SmartArtに対応。
  • OOXMLの数式(Word数式エディタ)に対応。
  • リニアライズドPDFの出力。
  • 大容量のEXCELファイルの1ページ目のサムネイル処理を高速化。
  • Word文書をPDF化する際にアウトライン階層をしおりに反映。(しおりを畳むレベルも指定可能。)
  • 異体字セレクタ(IVS)に対応。
  • Word文書の段組の段数や段幅の設定を再現。ページ途中の段数切り換えにも対応。

特に、SmartArtの対応は多くのお客様よりリクエストを頂いていたものです。
まだ未対応の機能もございますが、Officeの出力に近づけるよう日々改良をしていきます。

動作面では、大容量のEXCELファイルの対策を行っております。
サムネイル用途で1ページ目のみ画像変換したい場合にこれまで時間がかかっていたものが 大幅に速くなっています。


page2019へ出展

2019年 2月 6日から 2月 9日まで開催される「page2019」 にアンテナハウスは今年も出展致します。

バリアブル印刷や印刷物制作業務の効率化でのAH Formatter、PDF Tool APIの利用方法等を中心にDBとの連携、PDFを作成するだけではなく、今あるPDFの再利用をテーマにご紹介いたします。
また、PDF 変換などを行う各種システムコンポーネント製品など、企業内のシステム構築のための様々な支援ツールを、システム開発者、システム・インテグレータ向けにご紹介いたします。

また、弊社ブースへお越しいただき、お名刺の交換をさせていただいた方には、『PDF CookBook 簡易版』をご提供いたします。

■ ご紹介製品


  • PDF Tool API
    ページ結合・分割、しおり・注釈編集などのPDF加工機能をAPIです。
    ブラウザからの呼び出しでの利用方法をデモします。
  • AH Formatter V6.0
    XSL-FO を忠実に実装し、日本語組版など多くの拡張機能で商品レベルの書籍組版ができます。
  • PDF Driver V7.5
    GDI型の仮想プリンタドライバと、これを制御する付属APIのセット製品です。
  • OfficeServerDocumentConverter
    Microsoft Officeがインストールされていない環境でも、Word/Excel/PowerPoint等の文書をPDF/SVG/TIFF/JPEG/PNG/TIFF/INX/XPS ファイルへダイレクト 変換するライブラリです。
  • PDF Viewer SDK
    PDF の表示と編集の専用アプリケーション開発用ライブラリです。
  • その他
    PDFをOffice文書やXMLデータに変換、PDF内の画像を抽出する各種ライブラリ
    をご紹介します。

ご来場される際には、是非とも弊社ブースへお立ち寄りください。

■ 展示会詳細とアンテナハウスブース


「page2019」
会期:2019年2月6日(水)~2019年2月8日(金)
10:00~17:00
場所:東京・池袋 サンシャインシティ 文化会館
★アンテナハウスブース:4F 展示ホールB BT-5



マンガでわかる!! アンテナハウス システム製品利用例シリーズ

PDFに関わる製品の利用方法をわかりやすく説明するために、昨年よりマンガを作成して公開しております。第一弾は、「PDF作成、及びテキストボックス注釈編」として、

AH Formatter
PDF Tool API

での利用方法と

Office Server Document Converter

の違いを詳しく紹介しております。

そして、先週より第二弾として「PDF編集編」を公開しました。内容は、大量にある既存PDFへ透かしを追加する案件をPDF Tool APIを利用して実現する方法をお伝えしております。
また、今後に関しては、第三弾としてAH Formatterでの「XMLからHTMLとPDFAを出力編 」、第四弾としてPDF Driver APIの利用方法等、順次公開してまいります。


Microsoft OfficeでEPSが使えなくなったとの由。弊社製品の活用で解決する方法をご提案します。ぜひ、ご検討ください。

最近、弊社の営業に相談をいただきました件のご紹介です。

Microsoft Officeには、従来、図版としてEncapsulated Postscript(EPS)形式のファイルを挿入して使うことができました。しかし、2017 年 4 月 11日のセキュリティ更新プログラムより、これがデフォルトで無効(OFF)になりました[1]。

EPSについては、昔のブログで紹介しましたが、PDFの起源であるPostScriptという形式で図版を表現したファイルで、印刷などで使う高品質のグラフィックスを表現したファイルです[2]。

その時点では、レジストリーを書き換えるとこれを有効(ON)にできました。しかし、2018年5月からOffice 365では徐々にレジストリ書き換えが使えなくなり、10月にはOffice365の全ユーザーに対してレジストリ書き換えがつかえなくなりました[3]。

この記事ではEPSが使えない場合の代替形式として、EMF(Office 2007~2016、Office365について)とSVG(Office 365)を推奨しています。

なお、Office 2019では、SVGも使えるようになるとされています[4]。

そうしますと、EPSをどのようにしてEMFまたはSVGに変換するかがポイントです。以前のブログでも簡単に紹介しましたが、EPSを処理するにはPostScriptインタープリターという開発が大変難しいプログラムが必要です。EPSからEMF/SVG変換は簡単にはできません。

おそらく一番良いのは、EPSを作成したアプリで、EPSを一旦PDFとして保存します。またはAdobeのDistiller(PostScriptをPDFに変換するツール)、GhostScriptを使ってPDFにできます。

PDFをそのままOfficeに貼り付けられれば一番良いですが、それはできません。

そこで、PDFをEMFまたはSVGに変換して、Officeに図版として貼り付けることになります。

Office文書をPDFにしてから、PDFのページの一部に矩形を指定して、PDF図版を配置するというテクニックも可能です。

弊社製品では、次のツールをお使いいただけます。
① PDFをSVGに変換するには、Office Server Document ConverterPDF Viewer SDK
② PDFをEMFに変換するには、PDF Viewer SDK
③ PDFのページ上に、小さなPDF(図版)を配置するには、PDF Tool API 詳細「PDF CookBook」2–3 PDFページを描画

参考資料
[1] Office 2016 用のセキュリティ更新プログラムについて2017 年 4 月 12 日
[2] 2005年11月16日 EPS(Encapsulated PostScript)
[3] Support for EPS images has been turned off in Office Office365以外については、この記事では扱いが不明です。
[4] What’s New in Office 2019
[5] 図版でEPS形式ファイルが使えないときの対応策は? PDFにして貼付けるのが最適


Web Interface for OSDC 改訂版(V1.0 MR1) リリースのお知らせ ~ OSDC V7.0 リリース カウントダウン -1?? ~

慌ただしい1日が過ぎましたが、実は「OSDC v7.0」のリリースと同時進行で、もう一つの製品の改訂版の準備も進めていました。
OSDCの運用を支援するために開発された、「Web Interface for OSDC V1.0 MR1」のリリースです。
本日は、こちらについて紹介をさせていただきます。

Web Interface for OSDC

「Web Interface for OSDC」は、サーバ上のファイル変換ソフトをインターネット経由で遠方のクライアントから簡単に使用できる便利なソフトウェアです。サーバ側とクライアント側のパソコンに必要なソフトをインストールするだけで、新規にプログラムを開発することもなく、すぐに運用を開始できます。
変換には、『Office Server Document Converter V6.1』以降で使用できます。

インターネット経由でサーバ上のファイル変換ソフトにリクエストを送信し、結果をクライアントで受け取る方式です。クラウドを利用した大規模な Web サービスシステムも簡単に構築できます。

サーバ側とクライアント側のパソコンに必要なソフトをインストールするだけで、すぐに運用を開始できます。クライアントからのリクエストは『Office Server Document Converter』のコマンドラインインターフェイスと同じパラメータを用いたバイナリを提供します。コマンドのサンプルも多種ご用意しています。

『Web Interface for OSDC』は、サーバプログラムとクライアントプログラム、フォルダ監視サービスから構成されます。各プログラムは Java で設計されており異なるプラットフォームの相互間でインターネットを超えて連携することができます。

【基本機能】

  • プログラムレスでサーバ運用が可能
  • 簡単なコマンドでリクエスト送信
  • Windows、Linux の相互間で通信
  • フォルダ監視サービスで更に簡単利用

フォルダ監視サービスは、特定のフォルダにコピーされた文書を自動的に検出し、『Web Interface for OSDC』を利用して変換結果を指定されたフォルダへ出力するクライアント側のサービスです。

Web Interface for OSDC

詳しくは、Web Interface for OSDC をご覧ください。

また、今回の改訂情報は、こちらから ご確認いただけます。

評価版もご用意しております。
評価版は https://www.antenna.co.jp/sbc/wio/trial.htmlから、お申し込みください。


Office Server Document Converter v7.0 本日公開! ~ OSDC V7.0 リリース カウントダウン 0 ! ~

「Office Server Document Converter v7.0」を無事に本日リリース致しました。
昨日のブログでは、火だるま炎上を予想していましたが、むしろ「真っ白に燃え尽きた」感じです。
「立つんだ○○!」(世代がわかります・・・・)

では、あらためて製品を紹介させていただきます。

【強化される主な機能】

  • SmartArtに対応。
  • OOXMLの数式(Word数式エディタ)に対応。
  • リニアライズドPDFの出力。
  • 大容量のEXCELファイルの1ページ目のサムネイル処理を高速化。
  • Word文書をPDF化する際にアウトライン階層をしおりに反映。しおりを畳むレベルも指定可能。
  • 異体字セレクタ(IVS)に対応。
  • Word文書の段組の段数や段幅の設定を再現。ページ途中の段数切り換えにも対応。

【新しい商品構成】

  • Windows向け32bit版の終了
  • Select版(Word/Excel/PowerPoint)の終了

追加機能と新しい商品構成の詳細は、OSDC v7.0最新情報をご覧ください。
また、新バージョンのリリースに伴い、現行製品(OSDC v6.1/SBC v6.0)の販売を終了させていただきます。保守期間内のお客様に対する改訂版提供期間は、販売終了後5年間となります。
昨日は比較的見栄えの良い機能を紹介しましたが、本日は地味目なものからピックアップします。

○リニアライズドPDFの出力。

いわゆる、Web表示用に最適化されたPDFの出力機能です。
ここに出力結果の画像を貼付けても「だから何?」となりますので割愛します。

PDF出力の際に、以下のパラメータを追加して下さい。

-lpdf

地味です・・・。

○異体字セレクタ(IVS)に対応。

異体字には以前から対応していたのでは?と思われた方、使い込んでいらっしゃいますね。
ありがとうございます。
さいとう さんの 齊 齋 斎 斉 などですね。
これはそれぞれの文字に単独のコードが割り振られている異体字でして、今回対応したのは「異体字セレクタ」です。
異体字セレクタの説明だけでブログ数回分となりますので、詳細についてはこちらを参照してください。

一般的な文書ではあまり有難みは分からないかも知れませんが、人名・地名に関する書類では必須となります。
例えば、こんな感じでしょうか。

不動産や行政関係の業界の方々への朗報です。

○Word文書をPDF化する際にアウトライン階層をしおりに反映。

PDFのしおり、便利ですね。
せっかくWord文書でアウトライン化して目次まで作ったのに、PDFにしたらしおりがベタではつまらない。
そんな声にお応えして作りました。
しかも、しおりを畳むレベルも指定可能です。

・Word アウトラインレベル出力の設定に関するパラメータに追加
-docpdfbookmarklevel 値
0 : 階層を生成しません。
1-9 : 階層を生成して値の階層で畳みます。

値を色々変えて試してみて下さい。きっと楽しいですよ。

さて、今週初めのブログのタイトルは、「Office Server Document Converter のバージョンアップは何をもたらすのか?」でしたが、その回答をさせていただきます。

ユーザーの皆様には、OSDCの変換対象範囲の拡大と変換精度の向上、そしてより一層の利便性を。
製品担当者には、ストレスと緊張感と、その後に訪れるささやかな達成感、です。

お粗末さまでした。
OSDCに関する詳しい情報は、製品ページ https://www.antenna.co.jp/sbc/ を、ぜひ、ご覧ください。

評価版もご用意しております。
評価版は、https://www.antenna.co.jp/sbc/trial.html から、お申し込みください。


Pages: Prev 1 2 3 4 5 6 7 Next