月別アーカイブ: 2014年3月

Server Based Converter V5.0 改訂第4版(MR4)をリリース

 寒かった冬も終わり、やっと桜の季節になりました。

 Server Based Converterをお使いのお客様で、弊社と保守契約を結んでいらっしゃるお客様には、バグ修正を行ったメンテナンスリリース(MR)を配布しております。
 おかげさまで、Server Based ConverterもV5.0 改訂第4版(MR4)をリリースすることができました。
 保守契約を結んでいらっしゃるお客様で、該当するバージョンをお持ちの方は、ダウンロードして、お試しください。

 なお、他のバージョンにつきましては、今回、メンテナンスリリースはございません。
 以前、お知らせしました通り、
・最新版につきましては、従来通り、おおよそ3ヵ月に1回、年4回を目安とした配布。
・最新版以外のバージョンにつきましては、おおよそ半年に1回、年2回を目安とした配布
と、変更させていただいております。
 何卒、ご了承くださいますよう、お願い申し上げます。

・V5.0 改訂第4版(MR4)
 改訂内容は、
http://www.antenna.co.jp/support/update-sys/sbc/sbc50.html#v50mr4
を、ご覧ください。
 ダウンロードは、
http://www.antenna.co.jp/sbc/user_V50mrdl_in.html
から、行なってください。

 以前のバージョンの改訂情報は以下の通りです。

・V4.0 改訂第5版(MR5)
 改訂内容:http://www.antenna.co.jp/support/update-sys/sbc/sbc40.html#v40mr5
 ダウンロードURL:http://www.antenna.co.jp/sbc/user_V40mrdl_in.html

・V3.1 改訂第6版(MR6)
 改訂内容:http://www.antenna.co.jp/support/update-sys/sbc/sbc31.html#v31mr6
 ダウンロードURL:http://www.antenna.co.jp/sbc/user_V31mrdl_in.html

・V3.0 改訂第11版(MR11)
 改訂内容:http://www.antenna.co.jp/support/update-sys/sbc/sbc30.html#v30mr11
 ダウンロードURL:http://www.antenna.co.jp/sbc/user_V30mrdl_in.html

 Server Based Converterは、Microsoft Office, PDFなどのファイルを、PDF, Flash, SVG, 各種画像形式にダイレクトに変換する変換エンジンです。
 ダイレクト変換の意味は、たとえば、Microsoft Officeがない環境でも、ファイルさえあれば、それをダイレクトに内容を見える形式に変換できるのです。ダイレクト変換には、Microsoft Officeのライセンスも不要です。
 Server Based Converterは、ダイレクト変換というユニークさが評価され、多くのウェブサービス、パブリッククラウド、プライベートクラウドなどで利用されています。

 Server Based Converterに関する詳しい情報は、
http://www.antenna.co.jp/sbc/
を、ぜひ、ご覧ください。
 評価版もご用意しております。
サーバベース・コンバーター 評価版のお申し込み
から、お申し込みください。

 アンテナハウスのシステム製品につきましては、事前に技術相談会を行っております。お気軽にお問い合わせください。
 詳しくは、
アンテナハウス システム製品技術相談会
をご覧の上、お申し込みください。


各製品の改訂情報

アンテナハウスのデスクトップ製品は、製品の出荷後に見つかった問題の修正や
機能の改善などを行った際に改訂版を公開しています。

現在、販売中の『瞬簡PDF 統合版 7』に含まれている製品の
最新バージョンと公開されているURLは次の通りです。

・書けまっせPDF 5 バージョン5.1.0
http://www.antenna.co.jp/support/update/kpd/kpd50.html#kpd510

・瞬簡PDF 変換 8 バージョン8.0.4
http://www.antenna.co.jp/support/update/pdftooffice/pdftooffice80.html#srt804

・瞬簡PDF 編集 5 バージョン5.0.1
http://www.antenna.co.jp/support/update/pdfedit/pdfedit50.html#pde501

・瞬簡PDF OCR バージョン1.0.4
http://www.antenna.co.jp/support/update/pdfocr/pdfocr10.html#ocr104

※瞬簡PDF 作成 7 については現在改訂版はございません。

お使いの製品がどのバージョンになるのか、各製品の「ヘルプ」メニューから
「バージョン情報」を表示することで確認できますので、
最新版になっているかご確認頂き、古いバージョンをお使いであれば、
上記より、各製品の最新版を入手した上で改訂版を導入してください。

また、上記以外の製品についても改訂版を公開しておりますので、
詳細は下記「デスクトップ製品 改訂情報」ページをご参照ください。

http://www.antenna.co.jp/support/update/


瞬簡PDF 変換の便利機能 -その3-

『瞬簡PDF 変換』の変換以外の機能を紹介していますが、
今回、第3回目は「画像の抽出」機能です。

PDFファイルに入っている画像を抜き出して再利用したい。
そんな場合に便利なのが『瞬簡PDF 変換』の画像抽出機能です。

『瞬簡PDF 変換』の操作画面の上部に並んでいるアイコンから
「抽出」のアイコンを選択すると、
画面中央の抽出ファイルに「画像を抽出(.bmp/.jpg/.png)」が
選択できるようになります。

画像の抽出

画像の抽出

この状態で「実行」ボタンをクリックすると
PDF内に格納されている画像データのみを取り出して出力することができます。
また、特定のページにある画像だけを取り出したい場合、
ページを指定しての処理も可能となっています。

是非一度お試しください。


瞬簡PDF 変換の便利機能 -その2-

『瞬簡PDF 変換』の変換以外の機能を紹介していますが、
今回、第2回目は「テキストの抽出」機能です。

PDFファイルに入っている文字だけを再利用したい。
そんな場合に便利なのが『瞬簡PDF 変換』の抽出機能です。

抽出元となるPDFが、テキスト情報が格納されているPDFの場合、
『瞬簡PDF 変換』の操作画面の上部に並んでいるアイコンから
「抽出」のアイコンを選択すると、
画面中央の抽出ファイルに「テキストを抽出(.txt)」が
選択できるようになります。

テキストの抽出

テキストの抽出

この状態で「実行」ボタンをクリックすると
PDF内に格納されているテキストデータのみを取り出して
テキストファイルとして出力することができます。

また、スキャナなどで作成した、画像データのみが格納され
文字情報が入っていないPDFの場合は、
『瞬簡PDF 変換』の操作画面の上部に並んでいるアイコンから
「OCR」のアイコンを選択してください。

OCRを使ったテキストの抽出

OCRを使ったテキストの抽出

すると、画面中央の抽出ファイルに「OCR結果をテキストとして出力(.txt)」が
選択できるようになりますので、選択して実行を行うと、
OCRがPDF内の画像を読み取り、読み取った結果の文字を
テキストファイルとして出力します。

なお、抽出前に設定を行うことで、抽出するテキストファイルの
文字コードも指定可能となっています。

是非一度お試しください。


瞬簡PDF 変換の便利機能 -その1-

PDFファイルをOfficeファイルに変換する『瞬簡PDF 変換』ですが、
実はOfficeファイルへの変換以外にも便利な機能を搭載しています。
そんな機能を3回に分けて紹介していきたいと思います。
第1回目となる今回は「OCR結果をPDFファイルに埋め込む」機能です。

OCR機能を搭載していないスキャナで紙の原稿を取り込みPDF化すると、
画像データのみが格納されたPDFが作成されます。
このようなPDFファイルは内部に文字情報が入っていないため
ファイル内の文字検索を行うことができません。
しかし、そんなPDFでも『瞬簡PDF 変換』を使用して
PDF内に透明テキストを埋め込むことで、
文字検索が可能なPDFにすることができます。

『瞬簡PDF 変換』の操作画面には、
画面上部に変換先を選択するアイコンが並んでいます。
その中にある「OCR」のアイコンを選択すると
画面中央の変換形式に「OCR結果をPDFファイルに埋め込む(.pdf)」が
選択できるようになります。

透明テキスト付きPDFの作成

透明テキスト付きPDFの作成

この状態で「実行」ボタンをクリックすると
OCRがPDF内の画像を読み取り、読み取った結果の文字をPDF内に
透明テキストとして埋め込んで出力します。

簡単な操作で、より使いやすいPDFファイルが作成できるので
是非一度お試しください。


PDFの色指定について(2)

前回、PDFのデバイスカラースペースの3種類について説明しました。これらはその名前にある通りデバイスに依存したカラーの表現方法でした。そのため同じRGB値、あるいはCMYK値でも、デバイスが異なると違って見えることになります。同じ写真を2つの違うプリンタで印刷したり、同じ番組を違うテレビで見たり、といった身近なところでも経験することが多いかと思います。PDFの場合にあてはめれば、何か文書を作成してPDF化し、他の人にそのPDFを送って参照してもらうような場合に、作成した人が見ている画面と、送った先の人が見ている画面(あるいは印刷した紙)では別の色が表示されている、という現象になります。

このあたりを解決する、つまり異なるデバイス間で、同じカラー指定に対して同じ出力を行うことを目的としたカラースペースがCIEベースのカラースペースとなります。同じ出力といっても、当然ながら「そのデバイスの制限範囲内で」という制限がつきます。ディスプレイにしてもプリンタにしても、デバイスによって可能な色の再現範囲は異なりますので、その中で、指定に近い出力を得る(カラー値やカラースペースをどう調整しても、モノクロプリンタでカラー写真を印刷はできませんし)ことが目標となります。

前回記載したPDFで定義されている CIEベースカラースペース として、CalGray、CalRGB、Labは、および ICCBased の4種類を記載しました。これらのカラースペースの内容、指定されたカラー値を再現する方法の説明となるわけですが、PDFの仕様以前に、色とは何か、という非常にやっかいな説明が必要となってしまいます。わかる範囲で少し説明を試みてみたいと思います(デバイスカラースペースは、光の3原色、あるいは、プリンタのインクというような身近なところから、なんとなく理解できそうなので、色とは、などという説明抜きでなんとなく説明できましたが)。

おおざっぱにいえば、なんらかの光源から発した光が、物体にあたって反射し、人間の目に入り、人間がその物体の色として認識する、ということになります。赤いクルマといっても、太陽光の下で見る場合と、トンネル中の証明で見る場合と違うのは光源の発する光の性質が異なっていることによります。この光ですが、波としての性質を持つ、空中を伝わる振動エネルギーの束と考えることができるようです。波の性質として波長がありますが、高エネルギーの光の波長は短く(たとえば、X線では 1nm)、低エネルギーの光の波長は長く(ラジオの中波は100m~1km)なります。人間の目がとらえることができる可視光の波長は380nm~700nmのきわめて狭い領域ですが、この短波長側の光を紫、長波長側の光を赤として認識します。その外側を、がそれぞれ紫外線、赤外線と呼んだりします。また、虹などでは紫から赤までを適当に区切って7色と数えたりします。太陽光のような実際の光はいろいろな波長が混在した光です。可視光内で、緑の波長(国際照明委員会の規定では546.1nmだそうです)が多く含まれていれば緑、各波長の光が均等に含まれていると白と認識します。

ちょっと先走って、人間が赤とか紫とか認識すると書きましたが、人の目に入ってきた光は角膜、水晶体を通過して網膜にあたります。網膜上には光に反応する受容体として桿体、錐体というものが存在します。この錐体に可視光内の長波長(赤)に反応するもの、中波長(緑)に反応するもの、短波長(青)に反応するものがあり、それぞれの錐体がどのくらい反応するかで光の色を認識することになります。

色の話になってしまって、PDFのCIEベースカラースペースの話まで進めませんでした。こういう色というものをコンピュータ上でどう表現するか、さらにPDFではどう表現するか、また続きを記載したいと思います。


PDFの色指定について

これまで、PDFの関連仕様としてPDF/X,PDF/A などについて説明してきました。これらの各仕様の中には「カラーの再現性を保証」するために、PDFがサポートする各種カラースペースに対して制限を設けているものがありました。たとえば、PDF/X-1およびPDF/X-1aでは、使用できるカラースペースをCMYK(およびグレースケール)に限定しています。今回からPDFで使用できる色について、説明してみたいと思います。

PDFのカラー機能
まずPDFのカラー機能ですが、色を指定する機能と色を描画する機能に分けられます。
色を指定する機能
ページコンテンツの文字、線、画像、あるいは、ページコンテンツ以外のしおり、注釈といった各種オブジェクトに対して色を指定する機能になります。
色を描画する機能
色の変換やガンマ補正などを行ってPDF内に指定されている色を表示する機能です。

PDFの作成者側では、PDF内の各種オブジェクトに対して色を指定し、PDFの表示・印刷などの使用者側では、指定された色を解釈し、対象のデバイスで使用可能な機能を用いて指定された色を再現することになります。PDFの色指定には様々な方法が用意されています。表示する特定のデバイスに依存しない方法で色を指定することもできます。

PDFのカラー指定
次にPDFでカラーを指定する方法を見ていきたいと思います。
カラー値
PDF内での色の指定方法は各種存在しますが、通常、カラースペースを指定し、カラースペースによって決まるカラー成分毎に値を指定することになります。たとえば、RGBカラースペースであればカラー成分はR,G,Bの3成分を持ちますので、カラースペースとしてRGBを指定したのち、これらの各成分に対応する3種類の値を指定することになります。
カラースペース
PDFで使用されるカラースペースの説明に入ります。PDFのカラースペースは大きく3種類のカテゴリに分類されます。

  • デバイスカラースペース
    • DeviceGray
    • DeviceRGB
    • DeviceCMYK
  • CIEベースカラースペース
    • CalGray
    • CalRGB
    • Lab
    • ICCBased
  • 特殊カラースペース
    • Pattern
    • Indexed
    • Separation
    • DeviceN
デバイスカラースペース
出力デバイス上の表現に直接関係するカラー値を指定します。一番簡単な指定方法ですが、同じ指定をしても出力デバイスが異なれば違った色に見えることが多いという欠点もあります。

  • DeviceGray
    無彩色の光の輝度を白と黒の比率で制御します。カラー値の成分は1つであり、黒 0 ~白 1の範囲で表現されます。
  • DeviceRGB
    加法混色の3原色 赤・緑・青(R,G,B)を成分に持ち、各成分の値を 0(成分無)~1(最大輝度)で表現します。黒(0,0,0) ~白(1,1,1)となります。
  • DeviceCMYK
    減法混色の4原色 シアン、マゼンタ、イエロー、ブラック (C/M/Y/K)を成分に持ち、各成分の値を0(その成分無)から1(最大濃度)で表現します。白(0,0,0,0)から黒(1,1,1,0) となります。成分Kは、理論的には不要ですが、CMYのインクを混合して黒を生成するより黒インクを使用するほうが印刷上、きれいな黒が表現されるために使用されます。(0,0,0,1)も黒となります。

PDF内で、各カラースペースを混在して指定することができます。たとえば黒でABCと3文字表示されていても「A」はDeviceGrayの0、「B」はDeviceRGBの(0,0,0)、「C」はDeviceCMYKの(1,1,1,0)という場合もあり得ます。(PDF/XやPDF/Aではこのあたりの混在使用を禁止しています)

次回、CIEベースカラースペースについて説明したいと思います。


PDF Tool API V4.0にJava APIを追加!

みなさん、こんにちわ。

このたび、『Antenna House PDF Tool API V4.0』は改訂2版(MR2)を公開いたしました。
MR2では、新たにJava用APIが追加されています。
Java用APIはWindows用とLinux用、どちらも32bit用、64bit用の双方用意されています。

PDF Tool API V4.0は昨年10月に初版をリリースしました。
初版は、C++用API、.NET用APIとコマンドラインでしたが、今回Java用APIを加え、これでPDF Tool API V4.0としての製品形態が(ようやく(^_^;))整いました。
    PDF Tool API 製品紹介ページ

評価版がありますので、ぜひ、お試しください!
    PDF Tool API 評価版申し込み

旧バージョンのPDF Tool API V3.1と比較して、V4.0の特長は、なんといっても、

◎処理が速い!
下記のページに、一部ですが、速度比較テスト結果を掲載していますのでご参考ください。
    処理速度比較テスト結果

◎64bit nativeなAPI!
V3.1は32bit APIのみでしたので、動作環境が64bit OSでも32bitモードで動作するプログラムを作るしかありませんでした。
V4.0では、64bit nativeなAPIですので、64bit OSの利点を活かせる64bitプログラムの作成が可能です。
もちろん、32bit APIもあります。

◎Linuxに対応!
V3.1はWindows用のみでしたが、V4.0ではWindowsとLinuxの2つのプラットフォームに対応しました。
Linux用として、C++用API、Java用APIとコマンドラインがあります。C++用API、Java用APIについては、サンプルコードをたくさん付けましたので、評価版ですぐにも動かしてみることができると思います。

V3.1のユーザーさんにとりましては、V4.0ではインターフェースが変更になっておりV3.1との互換がないためバージョンアップには躊躇があろうかと思います(すみません。。)。
(わかりやすいかどうかちょっと自信がありませんが)V3.1との相違点を整理してみました。
    V3.1とV4.0のおもな相違点

V3.1を使用したプログラムの改変や動作環境の移行などの予定がございましたら(予定はなくても!)、ぜひ、V3.1→V4.0のバージョンアップをご検討ください!!


AH Formatter V6.2 製品発表会のお知らせ

アンテナハウス株式会社は、XML/HTML 自動組版ソフトのベストセラー『AH Formatter』をバージョンアップした『AH Formatter V6.2』を 2014年2月28日に出荷開始いたしました。これにともない、3月7日(金)に製品発表会を開催いたします。どなたでも無料で参加できますので、是非、『AH Formatter』の進化を知っていただきたく存じます。

製品発表会の詳細は次のページでご覧いただけます。
Formatter Club「AH Formatter V6.2 発表会」

今回のバージョンでは、MathML 描画エンジンが完全に書き換えられ、数式の組版がより一層強化されました。このとき、MathML の対応バージョンも AH Formatter V6.1 までの MathML 2.0 から 3.0 へ更新しました。
MathML 3.0 を含む MathML のサンプル(zip)出力結果 PDF

MathML 組版結果例
– MathML 組版例 –

また、ご要望の多かった次の機能などに対応いたしました。

  • フォント構築ファイルの設定でフォントフォルダのサブフォルダ内のフォントも検索が可能になりました。
  • font-variant に指定できる値が追加されました。
  • ボックスシャドウに対応しました。
  • テキストシャドウに対応しました。
  • 行グリッドに対応しました。
  • 複数ページに渡る脚注が可能になりました。
  • 表の各段に独立に行番号を振ることが可能になりました。
  • ページ分割されたセルでの表示内容が指定可能になりました。
  • tab-size プロパティに対応しました。
  • rgba() 関数が利用可能になりました。
  • トンボに見開きの背表紙の幅を指定可能になりました。
  • GUI 上に表示されるページサイズの単位が指定が可能になりました。
  • GUI で使用する表示上の言語の切り替えが可能になりました。
  • CSS で評価される @media の種別を指定できるようになりました。
  • PDF レイヤの指定が可能になりました。
  • PDF の埋め込み時に埋め込まれる PDF 内にあるリンクなどの注釈が保持可能になりました。
  • PDF へ埋め込むマルチメディアのプロパティが追加されました。
  • 組版の設定の既定値の見直しを行いました。
  • PDF 出力の設定の既定値の見直しを行いました。

行グリッドを使った組版例
– 行グリッドを使った組版例 –

既に『AH Formatter』をご利用の方も、自動組版にご興味をお持ちの方も、是非この機会に製品誕生から 14年目を迎えた『AH Formatter』の性能に触れていただきたく存じます。

・追記(2014年3月10日):
「AH Formatter V6.2 発表会」で配布した資料を公開します。『AH Formatter』の機能をご理解いただくのにお薦めです。是非、ご覧ください。
『AH Formatter V6.2』の数式組版と多言語組版の解説(PDF)
『AH Formatter』従来の機能と V6.2 で追加された新機能の紹介(PDF)