AH Formatter についてと FormatterClub のご案内
私(@MurakamiShinyu)は、AH Formatterの開発に携わっているのですが、そのことを人に話しても、AH Formatterはあまり知られていなくて、もっと知ってもらう努力をしなくてはと感じてます。
というわけで、AH Formatterとは何かということや、その意外に知られていないことについて、書きたいと思います。
■ AH Formatter(= Antenna House Formatter、アンテナハウス・フォーマッタ)は、組版ソフトであり、XMLやHTMLデータからきれいにページが組まれたPDFに変換するのに使われます。
■ W3C標準をサポートしてます。XML組版のための標準仕様であるXSL-FOと、Webのレイアウト用に普及しているCSSのどちらにも対応していて、目的に応じて使いたい方を使うことができます。
■ HTMLとCSSを解釈してレイアウトしてレンダリングを行うというところは、Webブラウザと共通しています。そのレイアウトエンジンは既存のWebブラウザ(例WebKit)を使うのではなく、私どもが独自に開発したもので、ブラウザでは不得意なページの組版の機能(CSS3 Page仕様のサポートなど)が充実しています。
■ CSSで、(X)HTMLだけでなくXMLの組版も可能です。
■ 各種組み込みインターフェースをもっており、サーバー利用でのPDF生成に最適です。
■ 世界で使われています。多言語の組版に役に立っています。様々な世界の文字での組版ができます。(例:アラビア語など中東の言語、東南アジアやインド系の諸言語)
■ OpenTypeフォントの機能をいろいろ活用することができます。IVSをサポートしており、異体字の選択ができます。
■ 日本語組版の機能も充実してます。縦書きと横書きの混在ももちろんできます。
■ CSS3のいろいろな機能をサポートしています。それでも不足な機能は独自拡張で追加しています。
■ 日々開発・改良を続けており、進化しています。
以下の記事もご参考に
評価版は以下のページよりお申し込みいただけます。
→ AH Formatter V6 評価版のお申し込み
AH Formatterをもっと知りたい、試してみたい、使っている人に聞きたいという方にFormatterClubをお勧めします。
会員(無料)には会員向け試用版の提供をしています。通常評価版では出力ページに「すかし」が入りますが、この会員向けはページの下部にAH FormatterのURLが表示されるだけになり、この表示を改変・削除しない限りにおいて、評価用に利用することのほか、個人的に文書作成に利用するなど、非営利目的に限って使用することが可能です。
それから、「CSS組版ブログ」もどうぞよろしくお願いします。
PDFのタグの使い方
前回、PDF/A-1aファイルのタグの内容を簡単に見てみました。PDFのタグは、元文書の論理構造やレイアウト情報を表現したり、PDF/UA にみられるようなアクセシビリティのサポートなど、さまざまな用途で使用されます。
PDF内には、ページコンテントと構造がそれぞれ独立して格納されていますが、互いに他方へのリンクを持っています。前回の例で、PDF/A-1a仕様で出力したタグの構造を見てみました。<見出し1>あるいは〈H1〉といったタグが出力されていました。これらのタグはページコンテント側の対応する箇所への情報を持っています。
Acrobatのしおり作成機能には、これを利用する方法「ストラクチャから新規しおり作成」が設けられています。
前回作成したサンプルのPDFにはしおりが存在しませんが、これを使用して作成してみます。
しおりのナビゲーションパネルを表示して、メニューを開きます。
「ストラクチャから新規しおり作成」を選択すると、ダイアログに設定されているタグの一覧が表示されます。
しおり作成の対象とするタグを選んでOKすると、選択した項目を使用して、しおりが作成されます。
このように、PDFのタグの機能は、タグ付けするアプリケーションと、それを利用するアプリケーションの連携で、まだいろいろなことができそうです。
PDF、そのほか、各種ご相談は
アンテナハウス システム製品技術相談会まで
PDF/A-1aのタグの見方
今回は PDF/Aの作成方法(準拠レベルA) でAcrobat/Wordが出力したPDF/A-1aの内容、主にタグ部分について少し見てみたいと思います。
レベルAではレベルBが持たない情報である文書の論理構造、言語などの情報を持つ必要がありました。PDFでは、文書の論理構造を表現するためにタグと呼ばれる仕組みを用意しています。
このあたりをつかって元文書がどのように表現されているか、Wordで簡単なサンプル文書を作成して、PDF/A-1aに変換したものを見てみます。
章、節、項の部分はWordの組み込みスタイルである「見出し1」~「見出し3」を使用し、
リスト番号を付加したものです。他に、箇条書き、表、画像 などを入れてみました。
Acrobat XIでは 「表示メニュー」の「表示切り替え」-「ナビゲーションパネル」-「タグ」とすることで、ドキュメント内につけられているタグの様子を見ることができます。左側にタグが階層表示され、ここをクリックすると本文内の対応する箇所がハイライト表示されます。
Word 2013で「PDF/A」および「アクセシビリティ用のドキュメント構造タグ」を指定して作成したPDFの場合
このように表示されます。
一方、Word 2013から Acrobat XIのWord用PDFMakerでPDF/A-1aを指定して作成したPDFの場合
となりました。
主なところだけ展開したキャプチャです。似たような構造ですが、タグの名前をはじめとして、細部では若干タグのつけ方も異なっていることがわかります。
PDFMakerでは「見出し1」など、Wordのスタイル名をそのままタグ名に使用しています。これら独自のタグ名をPDF仕様が用意している標準的なタグ名に割り当てる「ロールマップ」という仕組みがPDFに用意されていて、Acrobatでも表示させることができます。
これを参照すると、スタイル名の「見出し1」を標準タグの「H1」に対応づけていることがわかります。
このような形でタグを使用して元文書の論理構造をPDFで表現します。
また、比較のために、Wordの「見出し1」などのスタイルを使わずに、表示だけ似たような形の文書を作成してPDF/A-1a出力してみます。
ここの 章番号 1. 、1.1.1 などはWordのリスト番号ではなく、通常のテキスト入力したものです。
PDF/A-1aに変換した結果のタグを見てみます。
これはWordのPDF保存の場合ですが、このように、こちらでは文書構造を取得するヒントとなるものが存在しないため、単純に〈P〉タグだけで出力されていることがわかります。
以上、簡単なタグ付け内容の参照方法となります。
見積書・検収書など国税関係書類の電子化原本廃棄の事例公開中!
【大企業様の課題】
取引先からの請求書や納品書や見積書など、法令で保存義務があるので原本を保管されてます。
原本の保管は、場所を取るだけでなく、検索や参照に時間がかかり、持ち出し時の証跡管理や紛失などの危険を伴います。
【電子化と原本廃棄の事例公開など】
e-文書法の要件を正しく理解し、要件確保できれば電子化して原本廃棄が可能となります。
https://www.antenna.co.jp/edocmgr/pdf/CaseStudy2013_10_10-12.pdf
参考になりますので是非ご確認ください。
AH e-Doc Manager
電子署名・タイムスタンプ一括付与検証モジュールと公益社団法人日本文書情報マネジメント協会(JIIMA)活動の研究の成果を盛り込んだ、電子帳簿保存法「スキャナ保存対応用管理システム」です。
「導入コンサルティング」「国税関係書類等の電子化文書取扱ガイドラインの導入」「帳票OCRソフトウェア」「電子署名モジュール」「イメージデータ管理システム」「タイムスタンプサービス」を基本構造としています。
(パソコン・スキャナ機器およびサーバやストレージ、並びにトータルサポート等は、別途提案)
製品詳細
AH e-Doc Manager
資料のダウンロード
https://www.antenna.co.jp/edocmgr/function04.html
大企業のファイル変換基盤として大活躍のWeb変換システム事例
AH PDF Server V3はコマンドラインで制御が可能です。
このコマンドライン版をWe変換とSSOから利用すれば、効率的で安全なPDFやTIFFなどのファイル変換基盤を手に入れることが可能です!
【大企業様の課題】
フォルダ監視方式は大企業では、フォルダそのものの管理やメンテナンスが大変で、自分のファイルが他人に見られたり、他人のファイルを見てしまう恐れがあります。
【メリット】
- MS-ActiveDirectory連携のSSOで、自社ポータルからWeb変換システムが利用できます。
- AD情報と投入ファイル情報をDB制御して、確実に変換して、完了後、依頼者のブラウザーにメッセージを返します。
- 数千人規模の大企業で大きな効果を発揮します。
【実績情報】
公開事例:豊田合成株式会社様
https://www.antenna.co.jp/psv/pdfserver-jirei/
その他、放送系大手様、製薬会社大手様、電機系製造業大手様など多数稼働実績があります。
是非ともHPなど参考になりますのでご確認ください。
AH PDF Server V3
『AH PDF Server』 は、サーバーOS上で動作する、ファイル変換サーバーソリューションソフトウェアです。
オフィスドキュメントや画像ファイルなどを、予め設定した変換情報に沿って、自動でPDF等に変換、出力します。
製品詳細ページ
https://www.antenna.co.jp/psv/
評価版ダウンロードURL
https://www.antenna.co.jp/psv/trial.html
学術情報XML推進協議会分科会セミナー
11月1日、学術情報XML推進協議会さんからお招きをいただき、XSLT入門セミナーのスピーカを務めさせていただきました。学術情報XML推進協議会さんとは、学術論文を執筆するためのDTDであるJATSの普及に努められている団体です(http://xspa.jp/index.html)。
当日は20名ほどの方にご参加いただき、1時間半という短い時間の中で、JATSで書かれた論文をHTMLに変換するためのXSLTを実際に入力していただくという、実習形式のセミナーでした。
みなさん非常に熱心に話を聞いてくださり、必死に打ち込んでいただきました。
使用したテキストの一部
完成したHTML
本当はFOに変換してPDFを作るところまで持って行きたかったのですが、さすがに時間的に無理があり、概要説明だけさせていただいたしだいです。
また次の機会がありましたら、ぜひPDFに挑戦していただきたいと思います。
ご参加のみなさん、ありがとうございました。
DITA Festa2013 Autumn
10月23日~25日の3日間にわたり、富士ゼロックスさんに会場をお借りし、恒例のDITA Festaが開催されました。
初日はNECさんのDITAへの取り組みの話があり、スモールスタートの導入期から普及期に至るまでのご苦労された点など、結構生々しい話が聞けて楽しかったです。今はまだCMSを導入されていないようですが、そろそろ導入しないとやっていけない時期に差し掛かっているようです。
続いてDITAユーザー交流会から、CMSは本当に必要なんだろうかといことを実証実験したという話です。こちらも非常に興味深い内容でした。やはり大規模な運用となるとCMSは必須のようですね。NECさんの話とも重なって、説得力がありました。
2日目はオーサリングツールの紹介がメインで、XMetaL、oXygen、smart.DITA for Confluenceが紹介されました。
やはり日常的に多くの方が使うツールですので、参加者の皆さんも真剣に耳を傾けていらっしゃいました。
また弊社のAH Formatterの紹介もさせていただきました。
3日目は(おそらく)今回の目玉。DITA CMS製品の紹介です。Dante、Magillem Content Platform、NEXTDarwin、IXIASOFT DITA CMS、XDocs、SDL LiveContent Architectの6種類のプレゼンが行われました。1日でこれだけの製品の話が聞けるというのは、そうめったにあるものではありません。質疑応答にも熱が入っていました。
今までのFestaでは特定の製品紹介はあえて避けて来たのですが、多くのご参加者から「製品紹介が聞きたい」という声をいただき、今回の内容になりました。アンケートを拝見したところ「普段聞くことができないCMSについての話や製品比較ができて良かった」という感想が数多くありました。
また3日間にわたり「DITA入門講座」と称し、XMLとは何か?という話から始まって、DITAのコンテンツ再利用方法の話まで、つい最近DITAのことを知ったという方には絶好の企画もあり、こちらも非常に好評で「入門講座は非常に有意義だった」という感想をたくさんいただきました。
ほんとうにありがたいことだと思っています。ご参加されたみなさん、3日間お疲れ様でした。

Frankfurt Bookfair 2013 その2
Frankfurt Bookfairの会場はメッセ駅を降りてエスカレータで入口に直結します。
フランクフルト空港から電車で30分くらいのところ、オッヘンバッハに宿泊ホテルがありここから毎朝30分ほど電車に乗って会場に行きました。出展者パスというのがあり、開催前から終了翌日まで,フランクフルト市内・近郊での鉄道、バスなどの公共輸送機関の運賃が含まれている便利なパスなのでこれを利用しました。10月初旬なのに朝晩は寒く、道行く人はそろって帽子に厚手のコート、ブーツを履いて冬支度です。
フランクフルトには、トルコ系など、様々な民族が居住しているように見受けられました。当たり前に英語が通じると思ったら、ホテルのロビー以外はなかなか通じません。駅でちょっと行き先を聞いたりしたのですが、首を振られてしまいました。ここはドイツなんだと改めて思いました。
ブックフェアは最初の3日間はビジネスデー。名刺を持ってブースを訪れる人がほとんどでした。週末の土曜、日曜は一般デー。ここHall4.2は学術出版や専門技術を中心とするフロアーで、さすがに来場者はぐっと減りました。学生が友達と連れ立って、明らかに景品のボールペン狙いでやってきたり。コスプレ衣装を身につけた若者を見かけましたが、後でわかったのですが、コスプレをしてくると入場料が半額や無料になるんだとか。とにかく会場は半端なく広く、ブースの接客の合間にちょこっとなどでは見きれません。人気のフロアーは人の波に押されそうな賑わいでした。
アンテナハウスのように最新技術の電子書籍を紹介するブースは棚にあまり本が展示されません。代わりにプレゼン用のコンピュータとタブレットが数台おけるテーブルが設置されています。一方、アートや絵本などの展示コーナーは目を見張るほどの美しい本が本棚に並び対照的です。歴史ある古い聖書や大型本、装丁の凝った美しい本などを展示してある博物館のようなブースもありました。昔ながらの製法で製本を実演、革で栞をつくるところを実演しているコーナーもあり、最先端の技術と伝統技術のコントラスト、一口に本といっても様々で奥の深いものを感じました。
毎日の電車の乗り換えにも慣れ、ホテル周辺の道のりにもようやく詳しくなった頃、フランクフルトを後にしました。

Frankfurt Bookfair 2013
10月9日から13日にドイツで開催された Frankfurt Bookfair 2013にアンテナハウスは出展。クラウド型汎用書籍編集・制作サービス(CAS-UB)を主に展示して、日本からも参加して参りました。
日本からの出展会社は、文藝春秋、学研、岩波書店、医学書院、紀伊国屋、講談社、大学出版部協会、小学館、国連大学出版部、医学雑誌専門出版社のメディカルサイエンスインターナショナル等30社余りが出展していました。
日本からのお客様もブース番号を頼りに幾人か訪問してくださいました。ありがたいことです。日本の会社っぽくないですねと言われましたが、アンテナハウスは販売の拠点がアメリカのデラウェアにあるのでAntenna House, Inc. DEで登録し出展しました。また、DEの表示を見てドイツの会社と間違われる場面も。次回はUSAの文字をしっかり入れようと思った次第です。
さて海外のお客様の反応はといいますと、入口に立てた大きなCAS-UBのスタンドのEPUBの文字を見て入ってくる人が多かったです。またドイツのみならず、インド、フランス、イギリス、中国と各国の方々が、CAS-UBのデモに立ち寄っていきました。
確か前日にブースに来てくれた人が今度は技術系の担当者を連れてきて、熱心に説明を聞いてくれたフランスの会社。CAS-UBのトライアル版を申し込んで評価をしていただきました。
またEPUBで本を出版したいというポルトガルの作家さん。次の日に今度はご自分の出版した本を持参で、ある記号がEPBUで表示できるか試したいとのこと。ユニコードを使って無事表示することができました。Word文書から簡単にEPUB文書に変換できる点は良い評価を得たのではと思います。
いくつかアンテナハウスのリセラーパートナーもブースを構え出展していましたので、久しぶりにドイツのリセラーさんたちとの交流を楽しむことができました。十数年にわたって自動組版ソフトウェア Antenna House Formatterをヨーロッパで販売し、サポートをしてくださっている古くからのビジネスパートナーです。ブースにはもちろんFormatterのお客様も数多く足を運んでくださいました。
さて、あたりまえなのですが会場のブースを回ってみて、展示してある書籍やチラシが英語とは限りません。ドイツ語表示が多いです。多言語対応も考えなくてはと思いました。アンテナハウスのブースは教育、学術出版や専門技術を中心とするHall4.2と呼ばれるホールでした。ほかにも広い会場の中にはキッズ向け本の展示ホール、ノンフィクションや芸術の分野、インターナショナルのエリア、など様々な分野の展示が行われ、なんといってもFrankfurt Bookfairのコアなアクティビティは版権やライセンスなどの取引です。30カ国以上からやってくる600以上のエージェントが交渉を行います。
インターナショナルのコーナーは別として、私の見た限りですが、販売用はほとんどがドイツ語の本だったと思います。また、展示品が販売されるのはフェアーの最終2日に限られれていました。キッズ向けの美しい絵本と2014年のイラストカレンダーを買い求めましたが、やはりドイツ語でした。
明日も続いてご紹介します。