作成者別アーカイブ: AHEntry

アンテナハウスのもう一つの組版エンジン OSDC: Office Server Document Converterの生まれについて。いま初めて明かされる秘話。

アンテナハウスが世界に誇るXML組版エンジンといえばAH Formatter。2000年に発売以来20年目となる熟年ソフトウェアです。

AH Formatter

AH Formatterとは少し趣が違いますが、OSDC(Office Server Document Converter)はMicrosoft Office互換の組版エンジンとして、2005年に発売以来、順調に売り上げを増やしています。

OSDC(Office Server Document Converter)

実はこの二つは内部では技術をかなり共有しており、兄弟と言えます。当初はAH FormatterをMicrosoft Officeに対応させて特殊化した組版エンジンがOSDCである、といっても過言ではなかったくらいです。

実際のところ、2005年にリリースした最初のバージョンでは、Wordの文書をAH Formatterで組版していたのです。

サーバベース・コンバータ V1.0を出荷開始

このときは、Word:doc/docx⇒WordProcessingML⇒XSL-FO⇒AH Formatterで組版⇒PDFというパスになっていたと記憶しています。WordProcessingMLをFOにしてPDFにするスタイルシートはAH Formatter V4に内蔵していたものを使っていたはずです。

WordML変換

もちろん、このようなやり方ではWordのレイアウトの再現性が低いので、その後、OSDCは自力でdoc/docxを解読して、組版結果のレイアウトがWordのレイアウトと互換になるような、独自の組版エンジンとして作り直しています。

さらに、2016年09月30日発売のServer Based Converter V6.0 R1 (Ver.6.0.R1)から、Microsoft Word(docx)変換エンジンを全面的に作り直し、レイアウトの再現性を大幅に改善しました。

なので、現在のOSDCのWord組版エンジンは3世代目にあたります。

このあたりの経緯を知っている人は少ないし、すでに私の記憶も曖昧になりつつありますので、この機会に書き残しておきます。AH FormatterとOSDCは成長するにつれて、だんだん距離が離れていますが、なんとかOSDCにはAH Formatterの後を追って海外に雄飛してほしいものです。


『瞬簡PDF』ファミリー全製品の新バージョンを1月24日より発売します。

アンテナハウスのPDFデスクトップ製品の『瞬簡PDF』ファミリーは2020年1月24日より全製品のメジャーバージョンアップを行います。

今回のバージョンアップでは弊社製品として初めてPDF 2.0に正式対応致します。PDF 2.0 は2017年に策定されたISO 32000-2:2017で標準化されたバージョンで、セキュリティ機能などが強化されています。

さらに、『瞬簡PDF 書けまっせ 8』、『瞬簡PDF 編集 9』の製品のGUI(グラフィカル・ユーザー・インターフェイス)に組み込まれているPDF表示機能を高速化しています。

これ以外にも各製品個別にバージョンアップを行っております。個別の内容につきましては、下記の製品別ニュース・リリースをご参照ください。

『瞬簡PDF』ファミリーをオンラインショップや店頭などでお求めいただく場合は、シングルライセンスとなります。一方、企業・団体・官公庁などでは一括して購入していただくケースが増えています。弊社ではこうしたお客様向けに複数ライセンス(10ライセンス以上)を用意しています。

また、新バージョンより複数ライセンスの保守サービスの改定を行います。

『瞬簡PDF』ファミリーはすべてのライセンス形態に1年間の保守サービスが含まれております。複数ライセンスの2年目以降の保守サービスは、従来、営業窓口までご要望をいただいたお客様のみに詳細をご案内しておりました。新バージョンからは複数ライセンスの保守サービスの仕様を明確に決めて公開し、標準サービスとして有償にて提供することになりました。

『瞬簡PDF』ファミリーは無期限(永続)ライセンスなので、2年目以降の保守サービスをご購入いただかなくても継続して使用していただくことができます。しかし、近年はWindowsやオフィスなどの環境が頻繁にアップデートされます。また、『瞬簡PDF』のプログラムの瑕疵や改善にともなう改訂版が必要なこともあります。こうしたことから保守サービスの重要性が高まっており、ご要望いただくお客様が増える傾向にあります。

保守サービスを購入していただくことで、2年目以降も常に製品のプログラムを最新の状態に維持できるようになり、長期にわたり安心してお使いいただけます。


[書籍紹介] MathML 数式組版入門 英語版の販売開始

この度、2019年11月12日に「MathML 数式組版入門」の英語版「An Introduction to MathML Typesetting」の販売を開始いたしました。

AH Formatter

Amazon.com より販売中となっています。
An Introduction to MathML Typesetting

こちらの書籍「An Introduction to MathML Typesetting」は 2017年8月に発売した「MathML 数式組版入門」をベースにしたもので、海外の皆さんにも幅広く利用していただこうと翻訳に着手し販売に至りました。翻訳にあたっては海外の皆さんにご理解いただけるよう表現の全般的な見直しも行いました。

MathMLとは?と思われた方、これまで当ブログで MathML について紹介した記事を以下にまとめていますので、是非ご覧ください!
[AH Formatter] MathML への取り組み

日本語版の「MathML 数式組版入門」の販売も継続しております。
書籍は次の販売店よりお買い求めいただけます。
販売店:
Amazon.co.jp
三省堂書店
楽天ブックス
honto

「MathML 数式組版入門」は全文を PDF形式で無料公開していますので、ご活用ください。
MathML 数式組版入門(PDF形式)
 
 
AH Formatter ロゴ

本書や MathML の組版に使用した『AH Formatter』は以下のページより評価版をお申し込みいただけます。こちらも合わせてお試しください。
AH Formatter 評価版のお申し込み

『AH Formatter』についてお問い合わせがございましたら sis@antenna.co.jp 宛てにご連絡ください。


マークダウン原稿を AH Formatter を使って PDF にする

自動組版を使って製本するにあたって、原稿を何で書くかという選択は後に使う労力を決定する重要な要素です。
その執筆形態はさまざまなものがあります。
例としては XML や HTML がありますが、これらはタグを駆使して書く必要があります。
これらに対して、マークダウンは基本的にタグを使いません。
マークダウンで原稿を書いて、それを製本に使用できれば執筆作業が簡便化されるかもしれません。

マークダウン原稿から AH Formatter 経由で製本用の PDF を作成することが可能です。
あくまで一例なので、この方法が絶対というわけではありません。

その手順の概要としては
1. 原稿をマークダウンで書く。
2. マークダウン原稿を HTML に変換。
3. HTML を XSLT で加工。
4. AH Formatter を使い HTML+CSS で PDF出力。
という手順です。

今回はその手順をごく大まかに説明します。

まず原稿をマークダウンで書きます。
その原稿を Node.js の markdown-it というプラグインを使って HTML化します。
次に目次や索引を XSLT で付与します。
最後に、できた HTML と CSS を使って AH Formatter で組版します。
そうすると冊子本PDF が出来ます。

この手順により冊子本を作成する手段にマークダウンというもう一つの選択肢が出来ました。

今回は個々の手順をまったく掘り下げませんでしたが
アンテナハウスがこの実践を本にまとめたものがあるのでご興味のある方はチェックしていただけると幸いです。
→ 「簡単!Markdown+CSSによる冊子本作り -理論と実践-

販売は PDF版のみですが、300円(税抜)と非常にお求めやすくなっております。
 
 
AH Formatter ロゴ

『AH Formatter』の評価版は以下のページよりお申し込みいただけます。是非、お試しください。
AH Formatter 評価版のお申し込み

『AH Formatter』についてお問い合わせがございましたら sis@antenna.co.jp 宛てにご連絡ください。


Office Server Document Converter の新機能(予告)第2弾~EXCELのシートを出力する方法がいろいろ選べるようになりました~

昨日に引き続きまして、近日発売予定の「Office Server Document Converter v7.1」の新しい機能についてご紹介します。
発売前にネタバレして大丈夫なのかとのご心配は不要です。
なぜなら、既にでき上がっております(・・・・ほとんど)。
出来上がっているのになぜ出さないのかについては、企業秘密とさせていただきます。

昨日はPowerPointのノートレイアウトの出力でしたが、本日はExcelのシート出力についてです。

現状のOffice Server Document Converterの機能には、「-xlssheetorderselect」があります。

  1. 指定したシートを順番に出力する機能。
     -xlssheetorderselect

    シート番号 : 「,」で数値を出力順に指定します。「-」で数値範囲指定も可能です。

    任意のシートを選択して出力することができます。便利な機能です。
    ところが、シート番号を指定するのが面倒くさい、入力を間違いやすい、もっとホイホイ選べないの、という貴重なご意見をいただきました。
    そこで、Excel上でホイホイ選択したシートをそのまま出力してしまう機能を新たに用意しました。それがこちらです。

  2. Excelファイルを保存した際に選択されたシートだけを出力する機能。
     -xlsselectedsheet

    1)  Excelで選択状態のシートだけを出力した例。
    Sheet1のみ選択しています。

    xlsselectedsheet1

    「-xlssheetorderselect 1」と同じ結果になります。

    2)  複数のシートを選択して保存したExcelを出力した例。
    Sheet1、Sheet3、Sheet5、Sheet7を選択しています。

    xlsselectedsheet2

    「-xlssheetorderselect 1,3,5,7」と同じ結果になります。

    3)  複数のシートを選択して保存したExcelを出力した例。
    Sheet1、Sheet2、Sheet4、Sheet5、Sheet7を選択しています。

    xlsselectedsheet3

    「-xlssheetorderselect 1-2,4-5,7」と同じ結果になります。

    PDF、MTIFFに出力した場合は、シートは1個のファイルに合冊されます。便利な機能です。
    ところが、PDFをバラバラに出力できないの、後から分冊アプリを使うのは二度手間なんですけど、という貴重なご意見をいただきました。
    そこで最初からシートをバラバラに出力してしまう機能を新たに用意しました。それがこちらです。

  3. ExcelファイルをPDFに変換する場合に、シート単位で出力する分冊機能
         -multivol -start (開始シート)-end (終了シート)

      -start/-end を指定しない場合は、最初のシートからまたは最後のシートまでが変換対象になります。

    1)  Excelを各シート単位で分冊したPDF形式に変換した例。

    Sheet1からSheet3を指定して出力した例。

          -multivol -start 1 -end 3

    multivol1

いかがでしたでしょうか。便利な機能です。
発売が待ち遠しいですね。もうしばらくお待ちください。近日発売です!

Office Server Document Converterは、皆様の貴重なご意見をこれからも製品開発に生かして行きます。

クラウド環境でMS-Officeのライセンス問題を気にすることなくお使いいただける「Office Server Document Converter」 をご利用ください。
まずは 評価版 をお試しください

OfficeドキュメントのPDF変換に、Officeスイートのインストールは必要なし!
詳しくは、「マンガでわかる!!OSDCでオフィス文書の変換にOfficeは必要無し編」をご覧ください。


Office Server Document Converter の新機能(予告)~PowerPoint(PPTX)ファイルのノートレイアウトを出力~

近日発売予定の「Office Server Document Converter v7.1」の新しい機能についてご紹介します。

パワーポイントを使ってプレゼンをする際に、発表の要点をメモ書きしておくために「ノート機能」をお使いの方は多いと思います。
複雑怪奇な専門用語を噛んでしまったり、万が一「真っ白」になってしまった場合の用心に便利です。
以前は手元にメモを用意したりしてましたが、これですといかにも「カンペ」を読んでいる感じはしないので見た目はスマート、自分も安心です。
スライドだけでは説明しきれない情報を盛り込んでいる場合も多く、また自分自身の備忘録にもなり、後から資料として活用する際には重要な補足データとなります。
また、スライドの詳細説明や会議の議事録をメモしておくことにも使える便利な機能です。

書面(紙)で回すドキュメントだけでなく、ペーパーレスの時代ではプレゼン資料も重要なドキュメントです。やはり共通のフォーマットで保存しておきたいですね。

ということで、これまではスライドレイアウトしか変換できなかったOffice Server Document Converterに、ノートレイアウトを出力する機能が追加されます。

使い方は簡単。
コマンドラインを例にあげると、以下のオプションを付けるだけです。

-pptnotes

例えば、以下のスライドを変換します。

pptnotes1

「ノート表示/縦方向」で設定し出力した結果です。
下の余白がちょっともったいないでしょうか。でも、オリジナル通りです。

pptnotes2

「ノート表示/横方向」で設定し出力した結果は以下の通りです。
スライドが小さくなってしまいまいましたが、とりあえずオリジナル通りです。

pptnotes3

「ノート表示」でスライドの大きさを拡大すれば出力結果も拡大できます。
ただし、「標準表示」に戻した際にはみ出してしまいますのでお気を付けください。

出力されるノートの範囲は、各スライドの1ページ目のみです。
ノートにてんこ盛りに書き込んで複数ページとなった場合は2ページ以降は出力されません。上の6行までが出力されて、欄外の4行は切れているのがおわかりになりますか。
現時点では制限事項ということで、ご容赦ください。

pptnotes4

クラウド環境でMS-Officeのライセンス問題を気にすることなくお使いいただける「Office Server Document Converter」をご利用ください。
まずは 評価版 をお試しください

OfficeドキュメントのPDF変換に、Officeスイートのインストールは必要なし!
詳しくは、「マンガでわかる!!OSDCでオフィス文書の変換にOfficeは必要無し編」をご覧ください。


ユーザーサポート

ユーザーサポート担当です。

先日、久しぶりに地元のマラソン大会に参加してきました。
タイムは散々でしたが、穏やかな秋の日差しの下、たくさんの声援に元気づけられ気持ちのよいゴールを切ることができました。
大会は参加人数が千人にも満たない小さなものでしたが、地域の人たちがたくさんボランティアで参加されていて、また沿道ではお年寄りからお孫さんまで家族総出と思えるような人たちからもランナーに応援をいただき、心温まるものがありました。
勝手な思い込みかも知れませんが、この日ばかりは地域全体が「ランナー・ファースト」で、目一杯のおもてなしをいただいたような気がしました。

マラソンで思い浮かぶのは、来年の東京オリンピックのマラソン・競歩の会場変更を巡るここ最近の騒動です。
本番まで1年を切った段階で東京から札幌に会場が変更されたのも驚きですが、その理由が「アスリート・ファースト」にあると聞いて更に驚いてしまいました。
今回のオリンピックは、猛暑の時期の開催や米国のテレビ放映に合わせた競技スケジュールなど、当初から「アスリート・ファースト」ならぬ「マネー・ファースト」の都合しか感じられず、選手へのリスペクトはどこかに置き忘れられているといったら言い過ぎでしょうか?

もとより、へぼいランナーが小さな大会で感じる喜びと、トップアスリートがオリンピックで得られる栄誉では比較にならないでしょう。
しかし、オリンピックと前述のささやかなマラソン大会とは、規模の差こそあれ、競技の場を提供して選手を集め、選手も観客も共に競技を楽しもうとするところでは共通点があると思います。
その上で、前述の大会にあってオリンピックにないものがあるとすれば、それはやはり選手を迎え入れる側の、利益優先でなく選手優先で考え応援しようとする心のありどころのように思えてなりません。

やや強引ではありますが、私たちも製品をお客様に提供して対価を得る営利企業として、競技大会の主催者に似た立場にあるのではないかと考えます。
利益優先の考えではなく、お客様のニーズを汲み上げ役に立つ製品を開発してお客様に喜んでいただくことが結果的に利益にもつながるのではないかと思います。

今後も「カスタマー・ファースト」で丁寧なサポートを心がけて行きますので、よろしくお願いいたします。


生活習慣病対策に、インターバル速歩を実践しよう

ここに紹介しているのは、『ウォーキングの科学 10歳若返る、本当に効果的な歩き方』(能勢 博著、ブルーバックス、2019年10月発行)に書かれていることです。高齢化社会に向けてたいへん参考になりそうなので、紹介します。

まず、「インターバル速歩とは、本人がややきついと感じる早歩きと、ゆっくり歩きを3分間ずつ交互に繰り返すというウォーキング方法である。それを1日5セット、週4回以上繰り返すと、5か月間で体力が20%向上する」という。(まえがき)

具体的にインターバル速歩は次のように実践します。
・軽い運動のできる服装で底が柔らかく踵にクッション性のある靴を選ぶ。
・視線は25m先に向けて、背筋を伸ばした姿勢で歩く。
・できるだけ大股であるく。腕を振ると良い。
・スピードは「ややきつい」と感じる程度。5分間あるけば息が弾み、動悸がする程度。
・速歩の時間は3分を基準とする。
これを週4回以上繰り返す。週合計で速歩きの時間が60分になるようにする。5か月繰り返せば効果がでる。(pp.97-98)

30歳を過ぎると男女を問わず体力が少しずつ低下する。これは、加齢による筋力の低下が原因である。(pp.27-28)

最近は、体力の低下が高血圧、糖尿病、肥満といった生活習慣病の原因になると考えられるようになった。生活習慣病にとどまらず、認知症やがんに至るまで、中高年特有の疾患の根本原因は、加齢性筋減少症に伴う体力の低下である可能性が高い(p.28)。

体力の低下を防ぐために、1日1万歩歩くというような方法が勧められているが、松本市の「松本市熟年体育大学」事業に著者が協力した中で、その効果の検証を行ったところ、体力の向上はほとんど見られなかった。これはおそらく、普通に歩くだけでは運動の強度が弱すぎるためだろう。(pp.51-52)

現在の通常の筋力トレーニングは、アスリートや若者向けに考えられているものが多く、中高年は採用しにくい。また、マシンを使ったトレーニングは効果があるが、時間の制約やコストが大きすぎてゆとりのない人には採用しにくい。(pp.59-62)

著者たちが考え出した「インターバル速歩」は実践しやすいのが特徴である。例えば、きつい速足を30分間やってほしいというとみな逃げてしまい、継続できない。(p.211)

それに対してインターバル速歩は定着率が高い。つまり、継続してやれるのである。(pp.113-116)

インターバル速歩を実践した結果として、最高酸素消費量などの指標でみる体力が上がる。体力が上がると生活習慣病の指数が下がる。生活習慣病は体力強化で予防できるだろう。(p.74)

本書には、実験による効果検証のデータがたくさん出てきており、科学的な検証を行っているところが非常に良いと考えられます。詳しく知りたい人は、ぜひ、本書をお読みください。


ドロップキャップ

ドロップキャップとは段落先頭の文字を大きく組むことで、書籍の組版ではよく行われています。しかし、AH Formatter V6 にはドロップキャップの機能はありません。XSL-FOやCSSに勧告された仕様はありませんが、CSSにはドラフト仕様があります。

4. Initial Letters

そこには次のようなサンプルが最初に示されています。

sample-1
これをFOで強引に組むには、いろいろやり方がありますが、例えば次のようにしなければなりません。

<fo:block>
<fo:float axf:float-x="start" axf:float-wrap="wrap">
<fo:block-container height="5em" margin-top="-1.67em">
<fo:block font-size="5.53095em">É</fo:block>
</fo:block-container>
</fo:float>tudiant (au féminin étudiante) est un mot dérivé du latin ...

ここでは、font-size と margin-top などを手計算で設定して大きさと位置を合わせています。これらは、ドロップキャップが次のように配置されるように計算されています。cap-height や baseline の位置は、使用しているフォントによって決まります。

initial-letters-cap-height
AH Formatter でドロップキャップを自動組版するためには、これらの値を自動的に計算することが必要になります。そして、CSSのドラフトに合わせると次のように指定できればよいでしょう。

<fo:block axf:initial-letters="3">Étudiant (au féminin étudiante) est un mot dérivé du latin ...

これはもっとも単純な例で、実際のドロップキャップはこんな単純ではありません。<fo:float>を利用する実装では、本当の<fo:float>が絡んできたときの制御はとても複雑になります。CSSのドラフトは、行の高さが一定であるという暗黙の前提があります。行の高さが途中で変化するようなケースでは、結果を利用者が予測できず実装も極めて複雑になるでしょう。

ドロップキャップは、次期 AH Formatter で対応される予定です。


『Antenna House AHPDFXML 変換ライブラリ』のコマンドライン

『Antenna House AHPDFXML 変換ライブラリ』は、PDFファイルの内部データを、
XML(Extensible Markup Language:拡張可能なマークアップ言語)形式に変換するプログラムです。
このライブラリが出力するXML形式を「AHPDFXML形式」と呼びます。
PDF解析技術により文書構造を生成して、再利用に適したXMLデータを出力します。

『Antenna House AHPDFXML 変換ライブラリ』には、コマンドライン版アプリケーションが付属しています。
今回は”AHPDFXMLCmd.exe”について書いてみたいと思います。

標準の引数は次の通りです。

  • -i PDFファイル
    入力PDFファイルのパスを指定します。(必須)
  • -password パスワード
    入力PDFにパスワードが設定されている場合、この引数で指定します。
  • -o 出力先フォルダ
    AHPDFXML形式を出力するフォルダのパスを指定します。(必須)
    保存するしおり外部ファイルの形式を指定します。

      このフォルダには、カタログXML, ドキュメントXML, スタイルXML, アウトラインXML, 画像ファイルなどが出力されます。
  • -p 接頭子
    AHPDFXML形式ファイルの接頭子を指定します。(必須)
  • -start 開始ページ
    変換対象とする、開始ページを指定します。
    省略された場合や 0以下の場合は、先頭ページからとみなされます。
  • -end 終了ページ
    変換対象とする、終了ページを指定します。
    省略された場合や実際のページ数より大きい場合は最終ページまでとみなされます。

変換オプションの引数(一部)は次の通りです。

  • -piece
    文字情報(ahp:run)を、1文字単位で出力します。
    文字単位でレイアウト座標を得たい場合などで使用します。
  • -cid
    文字情報(ahp:run)の要素に、PDFのキャラクタIDを出力します。
  • -notable
    表の解析を行いません。表情報(ahp:table)も出力されません。
  • -emf
    線画をEMFに変換します。
    複数の線画をまとめられる場合は、まとめてPNGに変換します。
    PDFのページ中に表が存在する場合などは、まとめてPNGに変換することはしません。
    この条件が設定されていない場合は、線画はSVG形式に変換されます。

呼び出し例は次の通りです。

  • AHPDFXMLCmd.exe -i input.pdf -o output -p pdfxml -piece
    • -i input.pdf : input.pdf を読み込みます。
    • -o output : AHPDFXML形式を output フォルダ下へ書き出します。
    • -p hoge : 書き出されるファイルの接頭子です。
    • -piece : 文字情報を1文字単位で出力します。

AHPDFXML形式の利用例として『サンプルXSLTスタイルシート』をご用意しております。
XMLで表現することによって、データの扱いが容易になります。
XMLのメリットを最大限に活かしてPDFデータを活用できます。
弊社ウエブサイトより評価版の申し込みが可能です。是非ご評価ください。

製品に関するご質問は
sis@antenna.co.jp(SYSTEM担当)
または
oem@antenna.co.jp(OEM担当)
まで、お気軽にお問い合わせください。

評価版のお申込
評価版のお申込ページ

Webページ
http://www.antenna.co.jp/pdfxml/


Pages: Prev 1 2 3 4 5 6 7 8 9 10 ... 173 174 175 Next