« 2007年02月14日 | メイン | 2007年02月16日 »

2007年02月15日

中国語による索引のソートライブラリー(オープンソース)の公開

XSL Formatterで中国語(簡体字、繁体字)を組版して本を作り、その索引を作成したときに使える索引語ソート・モジュールをオープンソースとして公開しました。

こちらからダウンロードしていただけます。
Download I18N Support Library (about 5,694 KB).

このライブラリーを公開しているWebページはこちらです。
http://www.antennahouse.com/XSLsample/XSLsample.htm

ライブラリーについての簡単な説明は「I18N Support Library」の見出しの部分をご覧ください(申し訳ありませんが、英語のページしか用意できていません)。

このライブラリーのオリジナルは、アメリカのパートナーであるInnodata ISOGENが開発したものです。

概要は、Extreme Markup Languages 2002で発表されており、こちらで簡単に紹介しています。
「XSL Formatting Objectsのための国際化した巻末索引 」
※現在、オリジナルの論文PDFは、Web上では公開されていないようです。上のページのリンクをたどることができません。

2002年当時、XSL-FOの仕様には、巻末索引語の重複を削除する機能がありませんでした。Innodata ISOGENのJAVAライブラリーでは、索引語のソートや、索引語の重複削除などを行っていました。現在、XSL-FO V1.1仕様は、索引作成に関する仕様がかなり充実していますので、索引語の重複削除はXSL Formatterが自動的に行います。

しかし、索引語のソートは、XSL Formatterの標準機能にはありません。アンテナハウスでは、ある会社の多言語マニュアル組版システムを開発したのですが、中国語の索引のソートが必要になったため、Innodata ISOGENからライブラリーを入手して、中国語(簡体字、繁体字)のソート(並び替え)を行う部分を改造しました。

このライブラリーはもともとLGPLで提供されているものです。そこで、LGPLのルールに従い、このたび、改造したプログラムをLGPLライセンスのオープンソースとしてWebで公開したものです。ご活用いただければ幸いです。

投票をお願いいたします

投稿者 koba : 08:00 | コメント (0) | トラックバック