ハーバード大学の電子ジャーナルアーカイブプロジェクトの調査報告 (E-JOURNAL ARCHIVE DTD FEASIBILITY STUDY)を一読した。
・http://www.diglib.org/preserve/hadtdfs.pdf
この調査は、昨日話題としたNLM DTDの開発にあたって、標準的なアーカイブDTDが設計できるかどうかを検討するために行なったもので、Elsevier, Blackwell, BioOne, Nature, HighWireなど10出版社が作っているジャーナルのためのDTDとそのDTDによってマークアップしたジャーナルの記事のサンプルを集めて比較検討したものである。
いささか古いが、実証的な内容であり、XMLのDTDを設計したり運用したりする際には大変参考になる。また、コンテンツとスタイルの分離における生成コンテンツの扱いについても考えさせられる。
重要と感じた点をいくつか紹介する。(なお、レポートの本文中でSGMLと書かれている点を以下ではXMLと言い換えている。)
(1)XMLでは形式よりも意味でコンテンツにマークアップすることで、形式指示と構造情報を分離する。この際、どこまで分離するかで方針が分かれる。具体的には定型語句、カウンター(章番号、節番号、図番号など)、ラベル(箇条書きの記号など)、句読点などの扱いである。もし、これらを形式として内容から分離し、スタイルシートで生成するならば、XMLインスタンスをスタイルシート抜きで配布すると、最終の見栄えが分からなくなる。これに対して、定型語句などをXMLインスタンスに残しておけば、スタイルシートを一緒に配布しなくても良くなる。
(2)10社のDTDの中でWileyのものがもっとも複雑で、基本要素250個、表7個、数式7個(数式はTeXで記述しており、これをラップするXML要素が7個)の合計264要素で、簡単なDTDは100~130個である。実際のサンプル記事での要素の使用率は50%程度以下であった。その要素の1/4から半分が前付けの中で使われている。記事にしめる前付けの分量は少ないが要素の利用は前付けに集中している。
各社のジャーナル記事では次のような項目が様々に表現されており、ジャーナル記事をアーカイブするためのXMLではその内容の保持を検討する必要がある。
(1)定型文と生成テキスト ― 例)図のキャプションにおける番号、引用のテキスト
(2)論文のヘッダと前付け ― 表題、著者(姓と名の分離、順序)、著者の所属とリンク、付随する著者の参照情報、要約、脚注、略称と定義、著作権
(3)その他の前付け ― 記事の履歴(受付日など)、キーワード
(4)メタデータ要素 ― 出版社の名前・住所、ジャーナルのタイトル・略称・ID・ISSN・Coden、出版に関するもの(巻・号・番号・先頭ページ・最終ページ・発行日・価格)、記事の識別のためのメタデータ、記事のメタデータ(タイトル・記事の種類・図の数・表の数・数式の数・参照の数・ページ数・ワード数・言語)、スポンサー、目次情報(見出し・トピック・主題)、DTD情報(DTD名、バージョン)
(5)記事のヘッダー
(6)本文要素 ― 節見出し、リスト、テキストボックス、図、図の著作権、整形済みテキスト、Q&A
(7)オブジェクト配置 ― 固定またはフロート
(8)後付け ― 謝辞、付録、参考、用語、査読者の注、履歴
(9)参考文献
(10)表
(11)数式
この調査はNLM DTDを設計する前、すなわち様々なジャーナル出版社がばらばらにジャーナル用DTDを設計して利用していた時期のものであり、NLMができた現在では、統一化が進んでいるのだろう。
最後のほうに、Wileyが、ジャーナルの記事をSGML化するにあたって、データの妥当性をどのように確保するかについていろいろと行なった対策が紹介されている。マークアップの基準をつくるだけでなく、日々のデータ作成においてその基準に準拠させるために苦労していたようだ。
カテゴリー別アーカイブ: コラム
NLM DTD, JATS, XSL-FO Stylesheetsについてのメモ
欧米における学術情報誌(ジャーナル:Journal)の分野では、NML DTDと呼ばれる文書形式の採用が広がっているようだ。
NLM DTDの歴史に関しては、2011年3月の東京 J-STAGE3 説明会におけるBruce D. Rosenblum 氏の講演要旨を読むとよく分かる。
http://info.jstage.jst.go.jp/society/meeting/110309/meeting_110309_6.pdf
NLM DTDの開発はずっと米国医学図書館(National Library of Medicine) で行なわれてきたが、近年、プロジェクトが米国情報標準化機構(NISO)に移ることになったようだ。
これに際して、NLMの最終版としてV3.0が2008年にリリースされた。当初はV3.0をNISOに移管する予定だったが多くのコメントが寄せられたので、整理してV3.1を開発したうえで、NISOに移すことになった。
NLM DTD V3.1は、JATS(Journal Article Tag Suite)という名前に変更して、2011年3月に「試行用ドラフト標準」としてリリースされた。
6ヶ月のレビュー期間後、寄せられたコメントに対処する。その後NISOで投票を行い、JATS1.0 となる予定とのことである。
http://jats.nlm.nih.gov/about.html
NML DTDで作成されたジャーナルをAntenna House Formatterを使って自動組版して印刷している団体はNLMのほかに米国の大学、出版社に沢山あるとのことだ。
このためのXSL-FOスタイルシートの初歩的なものが、NLMのWebページで公開されておりだれでも入手できる。
・http://dtd.nlm.nih.gov/tools/tools.html
・ftp://ftp.ncbi.nih.gov/pub/archive_dtd/tools/
FTPサイトにあるJournalPublishing-XSL-FO.zipがそれである。
このスタイルシートは、Antenna House のXSL Formatter V2.5.2003.613をベースとして開発されており、MathMLを組版する機能を使っている。MathML以外は、アンテナハウス拡張を使っていないので、他のXSL-FOプロセサでも使えるとある。
このスタイルシートをベースとしてNML DTDの様々な機能をもっと活用したスタイルシートを作ることができるし、これによってカスタマイズ市場も生まれるのだろう。
公開されているドキュメントは、2006年にFormatter V3.3で組版されている。
随分古い・・・ 2006年という日付に化石を感じてしまう。
アンテナハウスFormatter V6のリリースにより、組版機能は大幅に強化される。
ちょうど、NMLもJATSとして一新される。この機会に、AH Formatterの新しい組版機能を利用して、ジャーナル組版分野における市場開拓を進めたいところだ。
自動組版ソフト「AH Formatter」とDITA (その3)
こんばんは。
昨日、XMetaL Authorには Open Toolkit が標準バンドルされていることをお話ししましたが、アンテナハウスは、DITA Open ToolKitのカスタマイズサービスも提供しています。
DITA文書のPDF出力のためのスタイルシート制作、HTML、その他出力のためのスタイルシート制作、多言語索引作成のためのスタイルシート制作等、多数の実績を持っております。また次のようなツールやサービスも提供中です。どうぞアンテナハウスの各種DITAサービスを存分にご利用ください。
AH Formatter用Open Toolkitプラグイン
DITA-OTの標準のビルドファイルでは Antenna House Formatter (XSL Formatter) がサポートされており、Formatterを起動してPDFを得ることができます。AH Formatter用Open Toolkitプラグインをどうぞお試しください。
OpenToolkit 1.5用多言語索引モジュール
DITAとDocBookで作成したドキュメント用の多言語索引制作モジュールです。主に欧米で広く使われている人気のライブラリです。Catalan、Czech、Danish、 German、 English、 Spanish、Finnish、 French、Hungarian、Italian、 Dutch、Norwegian、Polish、Portuguese、Russian、Swedish、Turkish、Simplified Chinese、Traditional Chinese、Japanese、Korean 21言語をサポートしています。
Word2DITA
DITA仕様に準拠したXMLインスタンス(トピック)を簡単に、間違いなく入力/編集するためのエディタがWord2DITAです。MSWordのアドオンソフトとして動作します。
●アンテナハウス海外サイト
http://www.antennahouse.com
http://rainbowpdf.com
来週は、中国のアンテナハウスです。
自動組版ソフト「AH Formatter」とDITA (その2)
こんばんは。今日はまた、少し違った視点で、DITAをみていきましょう。
DITAユーザがドキュメントをコンポーネント化して編集するのに必要不可欠なものはXMLエディタです。今回は世界が認めたXMLオーサリング製品の最高峰「XMetaL」シリーズについてお話ししたいと思います。
●XMetaL Author Enterprise
トピックの制作編集から、特殊化、内容参照、条件付きテキストといったDITAの高度な仕様も優しいGUIで実現できます。編集中のデータを直接PDF、HTML、WebHelp等へ出力できます。CMS製品ともシームレスな連携が可能です。ライティングしながら、いつでも最終出力形を確認できます。XMetaL AuthorにはOpen Toolkitが標準バンドルされています。
●XMetaL Reviewer
DITA topicをWeb環境で同時レビューし、各員から付された修正指摘やコメントをXMetaL Authorで一斉にデータ反映することができます。XMetaL Authorとの連携によって、執筆者が、レビュー指摘を文書へ反映するかどうかの最終判断をすることができます。また企業 CMS との連携により、既存のコンテンツ管理に Web 共同レビューの付加価値を統合することができます。
●アンテナハウスが日本販売代理店に
アンテナハウス株式会社は、このたびジャストシステムカナダ社との間で、XML編集ソフト「XMetaL」シリーズの販売代理契約を締結し、日本の株式会社ジャストシステムが日本語化した「XMetaL Author Enterprise Edition 6.0J」を含むXMetaLシリーズの国内販売活動を、2011年8月8日より開始しました。アンテナハウスは日本語版『XMetaL 6.0J』の国内唯一の販売会社です。
北米やヨーロッパでの市場展開において、すでに多くの企業に導入実績のあるXMLオーサリング・プラットフォーム製品「XMetaL」及びそのブランド力を引き継ぎ、国内におけるマーケティングおよび販売活動を実行していきます。
自動組版ソフト「AH Formatter」とDITA (その1)
こんばんは。今日から、少し話題を拡張し、現在取り組んでいるDITAについて、紹介します。
●欧米でDITAは広く普及
AH FormatterはDITAユーザに広く利用されています。毎年開催されるDITA Europe に、アンテナハウスは欠かさず出展し、ユーザとのコミュニケーション、情報提供を行っています。
DITAとはDarwin Information Typing Architectureの略で、技術情報を制作・発行・配布するためのXMLに基づいたアーキテクチャです。DITAは、OASIS(構造化情報標準促進協会)の支援の下にIBMが開発し、コミュニティに寄贈されたものです。
製品マニュアル、仕様書、操作説明書、業務手順書といった文書制作において、品質をコントロールし、かつ生産性を向上させることができるため、欧米では製造業、通信業、金融業を中心に導入がかなり進んでいます。 DITA技術を使ってドキュメントをコンポーネント化して編集し、そしてAH Formatter自動組版プロセッサ(AH Formatter)を使って出版物を自動生成するのです。
●国内でのDITA普及活動
欧米に比べて国内にはDITAに関する経験や情報が乏しく普及に後れを取っていたのですが、DITAに関わりの深い日本企業4社(日本アイ・ビー・エム、アンテナハウス、ジャストシステム、富士ゼロックス)が発起人となり、2009年2月にDITAコンソーシアムジャパンが設立されました。企業活動も今後ますますグローバル化していくなかで、実際、海外展開をしている国内企業はDITAの研究や検討を始めています。日本にDITAを普及し、DITAのノウハウの蓄積をはかり、開示し、国内におけるDITA導入による成功モデルを増やし、DITAに関わる新たな市場を創出することを目的としています。
活動の一環として、DITA Festa セミナーを年2回開催、先ほど述べましたDITA Europeに使節団を送ったり、さまざまな導入事例の発表が行われたりします。また、DITAアーキテクトであり、アンテナハウスの10数年来のアライアンスパートナーでもあるEliot Kimber氏を招待し、講演を行って頂くなど活動しています。
2011年8月29日には 国内初のDITAコンサルティング専業会社、「アートダーウィン合同会社」が設立されました。
海外展開をしている企業、DCJの活動を通じて、またDITAコンサルティング機能が加わることによって、国内にDITAが急速に広まっていく予感です。
米国国税庁でAH Formatter 案件が進む
こんにちは。
昨日AH Formatterが米国国税庁の新しいPDF配布ページに採用されたことをお話しました。このシステムは現在開発中で公開はもうしばらく先のことだそうです。
●組版について、とことん拘った「AH Formatter」
本プロジェクトでは、ページ組版の要求仕様は30以上リストアップされていましたが、マルチバイト文字, TaggedPDF, 多彩なページレイアウト等、すでに現行のAH Formatterで可能な機能がほとんどでした。但し、若干の不足機能がありましたので、それを強化しています。
強化中の機能は、次の項目ですが、近日発売のV6で標準機能として搭載されます。
1. 段組ページの上か下または指定された隅に段を跨るフロート配置
2. ページや段の任意の位置へのフロート配置
3. 改定バーの代わりに任意の文字を置く
4. 行折り返し時のインデント位置指定機能を追加
5. AcroForm による記入欄のあるPDFを埋め込み
フロート拡張については、近々、製品版としてリリースします。もちろんこの拡張機能のみならず、V6は魅力的な機能を満載しております。リリースまで待てない方、もう一つのアンテナハウスのブログで機能が紹介されております。どうぞ覗いてみてください。
CSS組版ブログ:AH Formatter V6 の紹介
https://blog.antenna.co.jp/CSSPage/2011/07/ah_formatter.html
●アンテナハウス海外サイト
http://www.antennahouse.com
http://rainbowpdf.com
海外でとっても活躍中!アンテナハウスの海外営業!
皆さんご存じのように、アンテナハウスは私たちの作ったソフトウェアを世界中の人々に使ってもらおうと、欧米市場での販売活動を行っています。
もう10年前になりますが米国フロリダ州オーランドで開催のXML Conference & Exhibition 2001に出展、海外展示会としては初出展をしました。2003年04月 米国Antenna House, Inc.を設立し、メリーランド州に事務所を開設、2007年08月 米国デラウェア州グリーンビルに国際販売オフィスを開設、2008年02月には、国際サポートオフィスをBethesdaからKensingtonに移転し、現在に至っています。
販売対象は自動組版・印刷ソフトウェアXSL Formatterからスタートしました。
現在では航空機・自動車のマニュアル、携帯電話・PDAの多言語マニュアル、各種技術文書、カタログ集、クレジットカード等の請求書発行まで
世界43カ国で幅広い用途で採用されています。
またFormatterに加えて、2007年10月 米国にて「Rainbow PDF」ブランドでPDF製品の販売を開始しました。
販売対象は以下の通りです。
Rainbow PDF Server Based Converter
Rainbow PDF Digital Signature Module(電子署名モジュール)
Rainbow PDF Desktop Converter(瞬簡/リッチテキストPDF)
Rainbow PDF Print Driver
Rainbow PDF Write (書けまっせ!!PDF)
最近の事例では米国国税庁(IRS)がAH Formatterを次期の組版システムとして採用することになりました。国税庁の発行する確定申告等に関する書類をアメリカの全国民が閲覧することになるなんて、うれしいことですね。
このことについては、次回お話しさせていただきます。
●アンテナハウス海外サイト
http://www.antennahouse.com
http://rainbowpdf.com
システム製品のライセンスファイルについて
昨日の内容と関連いたしますが、保守のご契約をいただくと、弊社よりライセンスファイルを送付いたします。このファイルについて、よくいただく質問がございます。
ライセンスファイルの更新をしないとどうなりますか?
・現在のお使いの製品バージョンをそのまま継続して使用する場合は特に問題ありません。
・新たに改訂版や新バージョンの製品を使う場合は問題が起きる可能性があります。
となります。
問題とは?
弊社のシステム製品は、ライセンスファイル内に保持している保守期限と、対象製品のリリース日を比較して、保守期限中にリリースされた製品ならば正規製品として動作するようになっています。
従いまして、古い保守期限を持ったライセンスファイルをそのまま使い続けるとその保守期限以降にリリースされた製品と組み合わせると、評価版として動作してしまうことになります。(製品使用時の日時は関係ありません)
このようなことにならないよう、改訂版や新しいバージョンをご利用される場合は、ライセンスファイルの更新をお願いします。
末永くソリューション・システムコンポーネント製品を快適にご利用いただく為に、是非とも保守更新サポートのご継続をお願いします!
ソリューション・システムコンポーネント製品の保守とは?
こんばんわ。今日はアンテナハウスの保守サービスについて、紹介いたします。
アンテナハウスのソリューション・システムコンポーネント製品には
次の3種類の保守形態があります。
・ 通常保守サポート
・ 特別保守サポート
・ 有償技術サポート
新規で製品をご購入された場合は、1年間の通常保守サポートが無償で提供されます。
1年経過後からは、有償で通常保守サポートの契約更新を承っております。
通常保守サポート期限が終了間近になりましたら、弊社保守窓口より、保守更新期限切れのご案内をいたしております。
通常保守サポート内容
1.お問い合わせの対応
2.不具合報告に対する対応
3.バージョンアップ版の提供
4.OSの移行
5.改訂版のご提供
上記の改訂版とは、障害修正などを行った製品のことをを示しますが、
改訂版がリリースされた時点で、ご購入ユーザ様にご連絡を差し上げております。
しかし、度々ユーザー様より、「改訂版の連絡が来ない」、といったお問い合わせをいただきます。
こちらよりご連絡をいたしますユーザー様は、ご登録いただいたユーザー様1名のみとなりますので、
もしも改訂版等の情報が届かない場合は、保守窓口hosyu@antenna.co.jp にてお調べいたしますのでご連絡ください。
改訂版のリリースは各製品により異なりますが、半月に一度から半年に一度リリースしております。
弊社ホームページの製品サイトも合わせてご確認ください。
なお、リセラー経由でご購入いただいたユーザー様は、すべての窓口がリセラーとなりますので
ご注意ください。
末永くソリューション・システムコンポーネント製品を快適にご利用いただく為に、保守更新サポートの継続をお願いいたします。
Formatter V6 開発の裏側、Formatter Club の活動内容とは?
こんにちは。営業日は毎日更新するつもりが、昨日挙げられなかったので、今日は2回アップします。
本日2回目は、Formatter Clubの活動内容をご紹介します。
●ユーザーのニーズを満たすより強力な製品開発
7/27に開催しましたFormatter Club発足会で「AH Formatter V6」の評価版を配布し、メーリングリストを通じて積極的にご意見、ご感想を頂いております。
これまでも、お客様のご意見、ご要望を参考に製品開発を進めて参りましたが、正式公開前のバージョンをお試しいただき、ご意見をお聞きすることでより強力な製品開発が出来るようになりました。
「AH Formatter」 は現在、帳票・レポートなどの単票から数千ページにも及ぶ技術マニュアルなど広い範囲で使用いただいております。
日本国内に限らず、海外で多く実績を持つ、グローバルなマニュアル作成にはもっとも適した自動組版エンジンです。
現状で50ヶ国語以上の多言語組版の実績があります。
●参加者やClub会員、開発者の知識・技能アップ
Formatter Clubでは、様々な分野の方々にお集まり頂き、「AH Formatter」に関してのご意見だけではなくXSL-FOもしくはCSSの技術に関しての意見交換も行い、参加された方々の知識・技能アップにも繋がります。
Formatter Club定例会を隔月で行い、最新バージョンの紹介の他、会員から実際に「AH Formatter」を使用した事例の紹介や討論会などを計画しております。
定例会に参加出来ない方もメーリングリストで意見やご質問を頂ければ他の会員から参考になる回答を得られると思います。
会員専用ページも開設しており、こちらでも最新バージョンの情報などをご提供いたします。
Formatter Clubはまだ発足したばかりですが、すでに40名の方にご参加・登録いただいております。
今後は参加会員様に、より有益な情報を提供出来るように、様々なイベントを企画してまいります。
Formatter Clubで、このようなことをして欲しいなどご希望があれば実施に向け検討させていただきます。
前回のブログでもご案内しましたが、第2回定例会を9/16(金)に開催いたします。
定例会後は、懇親会も予定しております。
この場で会員間の親睦を深めていただくことも出来ます。
過去にXSL-FOに取り組んだことはある(AH Formatterを使ったことがある)が現在は使用していない方、途中で研究が止まってる方、これから始めようとお考えの方など、どのような方でもご参加可能です。
ご興味ある方は是非ご参加ください。