« Microsoft Office のOffice Open XMLのISO化は難航? | メイン | Page2007、PDF/X -J Plus 協議会ミニセミナーなど »
2007年02月15日
中国語による索引のソートライブラリー(オープンソース)の公開
XSL Formatterで中国語(簡体字、繁体字)を組版して本を作り、その索引を作成したときに使える索引語ソート・モジュールをオープンソースとして公開しました。
こちらからダウンロードしていただけます。
Download I18N Support Library (about 5,694 KB).
このライブラリーを公開しているWebページはこちらです。
http://www.antennahouse.com/XSLsample/XSLsample.htm
ライブラリーについての簡単な説明は「I18N Support Library」の見出しの部分をご覧ください(申し訳ありませんが、英語のページしか用意できていません)。
このライブラリーのオリジナルは、アメリカのパートナーであるInnodata ISOGENが開発したものです。
概要は、Extreme Markup Languages 2002で発表されており、こちらで簡単に紹介しています。
「XSL Formatting Objectsのための国際化した巻末索引 」
※現在、オリジナルの論文PDFは、Web上では公開されていないようです。上のページのリンクをたどることができません。
2002年当時、XSL-FOの仕様には、巻末索引語の重複を削除する機能がありませんでした。Innodata ISOGENのJAVAライブラリーでは、索引語のソートや、索引語の重複削除などを行っていました。現在、XSL-FO V1.1仕様は、索引作成に関する仕様がかなり充実していますので、索引語の重複削除はXSL Formatterが自動的に行います。
しかし、索引語のソートは、XSL Formatterの標準機能にはありません。アンテナハウスでは、ある会社の多言語マニュアル組版システムを開発したのですが、中国語の索引のソートが必要になったため、Innodata ISOGENからライブラリーを入手して、中国語(簡体字、繁体字)のソート(並び替え)を行う部分を改造しました。
このライブラリーはもともとLGPLで提供されているものです。そこで、LGPLのルールに従い、このたび、改造したプログラムをLGPLライセンスのオープンソースとしてWebで公開したものです。ご活用いただければ幸いです。
投稿者 koba : 2007年02月15日 08:00
トラックバック
このエントリーのトラックバックURL:
http://blog.antenna.co.jp/PDFTool/mt-tbng2.cgi/597