アンテナハウスでは、オフィスソフトなどのアプリケーションがPDF Driver V5.0を使用してPDFを出力する機能を、プログラムから利用するためのAPIである「PDF Driver API V5.0」を新発売しました。
本製品は、「アンテナハウスPDF Driver API V3.1」のバージョンアップ版(後継製品)にあたります。
「PDF Driver V5」は既に昨年末に発売済みで、アンテナハウスの「瞬簡PDF4」などの製品に組み込んで販売しています。
今回の「PDF Driver API V5.0」により、システム・インテグレータが、「PDF Driver V5」を使ったシステムを構築することができるようになります。
○今回のバージョンアップの項目
・新バージョンではPDF 変換処理を複数の呼び出しで並行して行うことができるようになりました。これによって、Citrixなどのシンクライアント環境で使うシステムを構築することが可能になっています。
・詳しくは:
「PDF Driver API V5.0」改訂情報
○製品情報のページ
・PDF Driver API
・インストール・ライセンス・一般的なお問い合わせについて
○PDF Driver V5.0のページ
・PDF Driver
※PDF Driverは、単体での販売を行なっておりません。次のアンテナハウス製品に組み込んでおります。
・「瞬簡PDF4」
・「瞬簡/リッチテキストPDF6.1」
・「アンテナハウスPDF スイート4.1」
また、アンテナハウスPDF Driver V5.1は、サードパーティのアプリケーションに組み込んで再頒布するライセンスの販売を行なっています。
・OEMのページ
○PDF Driver API V3.1は販売終了しました
今回のPDF Driver API V5.0の発売に伴い、旧バージョンであるPDF Driver API V3.1は新規の販売を終了いたしました。今後は、保守サービスを継続して提供いたします。
日別アーカイブ: 2011年5月19日
UTF-8のBOM(Byte Order Mark)は想定外でした
この前の日記は、結局、日本語の混じったCSSをUTF-8で符号化した際にBOMをつけたためAdobe Digital Editionsが誤動作したらしい、という話になりました。お騒がせしました。
実はこのCSSはいまお勉強中のスタッフにいろいろ試してもらったものなのですが、彼女が使っているテキストエディタにはUTF-8をBOM付きで保存するメニューがあって、日本語テキストを保存するにはBOMが必要だろうと考えた彼女がBOM付きで保存してしまったようなんです。そんなこととはつゆしらず。大騒ぎしてしまいました。ゴメンナサイ。
でも、UTF-8にはBOMは本来必要ないんです。
BOMはByte Order Markの略で、UnicodeではU+FEFFのコードポイントが与えられています。次はUnicodeのコード表の一部。
http://www.unicode.org/charts/PDF/UFE70.pdf
※BOMのコードポイントが誤っていましたので訂正しました。
BOMのもとはByte Order(バイトオーダー)ということですが、これは例えば16ビット(2バイト)単位でデータを扱うとき、2つのバイトをどういう順序で扱うか(CPUのレジスタに取り込むか)ということを表すマークとして用意されています。UnicodeをUTF-16、UTF-32で表すときは意味がありますが、UTF-8は2バイト固定長ではなく1バイトずつの可変長でデータを扱うのでバイトオーダーは意味がありません。
私は10数年前、シフトJISとかISO-2022-JP全盛の時代で、XMLが出てきてUnicodeが使われ始めた時代にテキスト判別モジュールを設計した経験があります。これからはUnicodeの時代になるので、XML Editorのテキスト文字コード自動判別でも、シフトJISやISO-2022-JPだけではなく、UTF-8、UTF-16、UTF-32を自動判別できないとまずいだろうということで調べました。で、その当時はUTF-8にBOMをつけると言う発想は無かったと記憶しています。
でもいつの間にか、UTF-8にBOMをつけるテキストエディタが普及していたのですね。
最近は、UTF-8にBOMをつけて、これがUTF-8であることを示したり、UTF-8にASCII文字以外が入っていることを示すために使うとしているようです。しかし、これはBOM本来の意味ではありませんし、UTF-8はもともとASCIIコードだけのときにはASCIIコードと同じになるように設計されているわけだからBOMをつけるのはUTF-8の精神に反するような気もします。
それはともかく、古くからのソフトの中にはUTF-8にBOMがついていると、”想定外”ということで破綻するものがいろいろあります。Adobe Digital Editionsだけではないんです。
実はCAS-UBの中核になっているデータ処理系もUTF-8にBOMがついていると破綻します。このことは、ユーザーガイドに書いてないので早速追加しなくっちゃ。
「CAS-UBで扱うテキストや各種スタイルシートやテキストはUTF-8固定です。しかし、BOMはつけないでください。」
http://d.hatena.ne.jp/cassupport/20110518/1305751974 から転載。