
ツイート
« 2011年09月 | メイン | 2011年11月 »
2011年10月31日
アンテナハウス初の無償版の配布も! 「瞬簡PDFバインダー」発売
今日から、当社初のフリーミアム方式による販売、つまり基本機能を無料で、高機能版を有料(といっても3,150円)販売する方式で、「瞬簡PDFバインダー」を発売しました。
「瞬簡PDFバインダー」は、画面上の対話(ドラッグ&ドロップ操作)でPDFを結合したり、ページを並び替えたり、入れ替えたりできる製品です。
これまで、「PDFスイート」にスイート・ツールとして同梱していたツールに、操作性にさらに磨きを掛けて単独製品としたものです。
こんな感じの操作画面からPDFのページを整理して製本することができます。だからバインダーっていうんですよ。
しかし、PDFの製本だけではなくて、スキャナーを操作してスキャンした画像を取り込んだり、あるいは、(有償版は)Office文書を自動的にPDF変換したりもできます。さらに、元になっている文書が新しく更新されたら、自動的に検出して製本したPDFの該当部分だけを更新することもできます。
まずはとりあえず、フリー版をお試しになってみて、良かったら有償版をお求めいただくということもできますので、どうぞ。
○詳細情報Webページ
瞬簡PDFバインダーWebページ

投稿者 koba : 19:22 | コメント (0) | トラックバック
PDF関連ソフトウェア
こんにちわ。
今日は、ネットで見つけたPDFを扱うソフトウェアを紹介します。
PDF(Portable Document Format)は、1993年にアドビシステム社からPDF 1.0とAcrobat 1.0が公開になってから18年がたちます。
PDFを作成したり加工したりするソフトウェアも、かなりたくさん出ています。海外のソフトウェアが多いですが、日本語対応されたものが多くなりました。
昨今は、電子書籍の普及により、電子書籍向けのPDFにも対応したものがありますね。
○Primo PDF
フリーのPDF作成ソフト。有名ですね。
○JUST PDF 2
ジャストシステムのソフトウェア。
PDFの作成、PDFの加工や編集などができます。
ニュアンスコミュニケーションズ製品のOEM。
○PDFDiet
電子書籍向けに、画像⇔PDF間で変換したり、余白を削除したりする
機能があります。
○PDF Scissors
PDFの余白をカットするJavaアプリケーション。
複数ページを一括してカットできるというのが特徴だそうです。
明日は、Acrobat Xの機能をちょっとのぞいてみようと思います。
投票をお願いいたします
投稿者 AHEntry : 15:24 | コメント (0) | トラックバック
2011年10月28日
新発売『瞬簡PDF 変換 7』は、たいへんお買い得!!
新発売の『瞬簡PDF 変換 7』は、これまでよりお求めやすい割安な価格設定といたしました。
これは、PDF作成・編集ソフト『瞬簡PDF 作成 5』を今回より同梱せず、単体販売としたことによるものですが、これまで「瞬簡/リッチテキストPDF6(6.1)」をお使いいただいていたユーザー様には、『瞬簡PDF 作成 5』を廉価でご提供するサービスもご用意しておりますので、合わせてご利用ください。
また、他のアンテナハウス製品を既にお使いのお客様にも、『瞬簡PDF 作成 5』と『瞬簡PDF 変換 7』を割安な価格でご提供しておりますので、この機会に是非ご検討ください。
ご購入に関して、詳しくは、アンテナハウス オンラインショップをご参照ください。
さらに今回より、『瞬簡PDF 変換 7』を含めたアンテナハウスのデスクトップ製品を複数ライセンスでご利用されたい企業・自治体・官公庁・団体ユーザー様を対象に、これまでとはまったく異なる体系でボリューム・ライセンスをご用意しております。
新しいライセンス体系には、大きく分けて以下の3つがあります。
- AH-ULL:61ライセンス以上をお求めの企業・自治体・官公庁・団体ユーザー様向けで、“超お買い得な“価格体系となっています。
- サイトライセンス:10ライセンス以上のまとまった数量をお求めのお客様向けで、シンプルなライセンス単価を適用しています。
- シンクライアントライセンス:シンクライアント環境で利用するためのライセンスです。
最初の"AH-ULL"は、"エーエイチ・ユーエルエル"と発音します。聞き慣れないものですが、Antenna House-Unlimited License の略です。
多数のライセンスを使用する事業所の規模に応じて3つのタイプ(AH-ULL200/500/1000 )が用意されていて、それぞれ上限のライセンス内で無制限に弊社製品を使用可能になっております。
これらのライセンスについて、詳細は新ライセンス体系についてをご参照ください
これまで5日間に渡って、新製品『瞬簡PDF 変換 7』をご紹介させていただきました。弊社では今後とも改善を継続してよりよい製品をお客様にお届けするとともに、皆様のお役に立てる新しい機軸の製品開発も進めていく所存です。今後とも応援いただけますよう、よろしくお願いいたします。
投票をお願いいたします
投稿者 taishii : 09:00 | コメント (0) | トラックバック
2011年10月27日
新発売『瞬簡PDF 変換 7』では、Excelへの変換も改善しました!!
新発売の『瞬簡PDF 変換 7』では、変換精度向上のための改善をしています。
例えば、Excelへの変換では、以下の2点改善を行っています。
- PDFで縦書きのテキストをこれまでシート末尾にまとめて変換していましたが、Excelで縦書きテキストボックスを作成してシート上に配置するようにしました。
- 平方メートル、立方メートルなどの単位がこれまで[m][2]で別々の行に変換されていたものを1行にまとめるようにしました。
ひとつめは、PDF上に以下のような方向でテキストが記述されていた場合についての改善です。
このようなレイアウトはExcelのセルでは再現が難しいため、これまではシートの末尾に横書きテキストとしてまとめて出力していましたが、『瞬簡PDF 変換 7』では、縦書きのテキストボックスをそれぞれに作成し、その中にテキストを変換するようにしました。
Excelではセルによってテキストを配置しますので、テキストボックスでは必ずしも元のPDFのレイアウトを再現できませんが、縦書きテキストをテキストボックスにまとめることにより、これまでより変換後の編集がしやすくなりました。
ふたつめは、工事設計書などで良く見かける面積や体積の単位に関する改善です。以下の例をご覧下さい。
平方メートルや立方メートルの単位は、PDFに"㎡"のように文字コードで格納されていればそのまま変換されますが、"m"+"2"のように別々の文字として格納されて、"2"の方に上付きの位置が与えられていると、それぞれ別個に認識して別々に変換されます。
上記の例のようなPDFでは、これまで以下のように変換されていました。
これまでの変換では、"m"を含む行と"3"を含む行が別々になっています。これだと、Excel上で"3"部分を選択して上付き属性を付加するといった編集作業が簡単にできません。
そこで、『瞬簡PDF 変換 7』では、以下のような変換結果となるように改善しました。
これにより、"m"と"3"が1行にまとめられて、Excel上での編集もしやすいものとなります。
まだまだご紹介したい改善事項がいくつもありますが、紙数が尽きましたので、今日はこのへんで。
『瞬簡PDF 変換 7』の変換例について、詳細はPDF、画像ファイルからOfficeへ逆変換や、瞬簡PDF 変換 7 は国産最高の変換精度!をご参照ください。
『瞬簡PDF 変換 7』ご紹介の最後は、新製品の価格設定についてご説明させていただきます。

投稿者 taishii : 09:00 | コメント (0) | トラックバック
2011年10月26日
新発売『瞬簡PDF 変換 7』は、透明テキスト付きPDF作成にもひと工夫!!
新発売の『瞬簡PDF 変換 7』では、透明テキスト付きPDFの作成処理に新しい機能を追加しています。
- 透明テキスト付PDFとは、スキャナーで読み取った画像をOCR機能をつかって文字を認識し、コード化した情報(テキスト)として、PDFの画像の上に透明属性を持たせて重ねたものを指します。
PDFファイルの内容である文字情報を利用したいときは、テキストを取り出して利用できます。また、PDFファイルの中を検索してヒットした文字列の該当部分を反転表示することもできます。
具体的に説明します。
以下は本製品のユーザーマニュアルの一部ですが、通常の文字と画像が混在した構成になっています。
このような場合、既にテキストがページ上にあるので(図では反転表示にしています)、このままで文字列を検索することが可能です。
しかし、画像部分にある文字も検索対象にしたいといったときはどうでしょう?
そのような場合、通常は、このページ全体を画像化してOCR処理でテキストを取り出します。
そうすると、画像部分の文字もテキスト化できますが、元からあるテキスト部分もOCR処理することになり、場合によっては誤認識で文字化けしてしまう可能性があります。
また、ページを画像化することで、このページにあるしおりの情報(図の左側に表示されているツリー上の見出し部分)も失われてしまいます。
『瞬簡PDF 変換 7』では、透明テキスト付きPDFの作成時に、[元の情報を保持してOCR結果を埋め込む]という機能を選択できます。
これは、PDFの元の情報を保持したまま、ページ内にある画像だけOCR処理をして、その結果を透明テキストとして一緒にPDFに埋め込み、保存するというものです。
先ほどのPDFをこの機能をオンにして、変換してみます。
図で、反転表示している箇所がテキストになります。画像上の文字に対してもテキスト化されているのがお分かりになると思います。
また、ページの左側にある、しおり情報がそのまま保持されている点にもご注目ください。
様々な情報をPDF化してパソコンに蓄積し、必要なときに取り出して参照する方法は、たいへん便利なものです。
それには、多数のPDFファイルから必要なものを探し出せるように、検索性の高いPDFを作成することが重要になってきます。
既存のPDFのテキストデータを生かし、さらに画像化された文字までテキストデータとして検索可能にするこの機能を、PDFご活用にお役立てください。
『瞬簡PDF 変換 7』の透明テキスト付きPDF作成機能について、詳細はOCRによる透明テキスト付きPDFの作成をご参照ください。
明日はPDFからExcelへの変換時の改善についてご説明します。

投稿者 taishii : 09:00 | コメント (0) | トラックバック
2011年10月25日
新発売『瞬簡PDF 変換 7』は、OCR処理を高速化!!
10月14日から販売開始した『瞬簡PDF 変換 7』では、OCR処理を見直し、画像化されたPDFから従来の製品より正確な文字認識処理を行うことができるようになりました。さらにOCR変換時の処理速度も大幅にアップしました。
下のグラフは、旧製品(リッチテキストPDF6.1)と『瞬簡PDF 変換 7』を使用して、画像データを既定の条件でWordへ変換した結果を比較したものです。
平均して、OCRを使用した変換では旧製品比で40~50% の速度アップを実現しています。この数値は、実行環境や元画像の状態、自動で回転や傾き補正を行うかどうかなどの条件によっても異なってきますが、多くの場合で処理速度の向上を実感していただけるものと思います。
また、操作画面においてもOCR処理がしやすくなる改善を行っております。
これまで、OCRを行う際の変換条件は、画面上に登録された複数のファイルに対して一括で適用されるようになっていましたが、今回これを見直して、ファイル個別に変換条件を指定できるようにしました。
手順としては、
- 最初にメニューバーから[ツール]→[OCR設定の既定値...]を選択します。これにより全体のOCR変換条件を指定できます。
例えば、日本語文書を変換する機会が多い場合は、言語指定で[日本語]を選択して置きます。 - 次に登録されたファイル欄に表示された[OCR設定]ボタン(上図で赤枠内にあるオレンジ色のボタン)をクリックします。これによりファイル毎に異なるOCR変換条件を指定できます。
例えば、選択したファイルが他と違い英文の文書であったなら、OCR変換条件で言語指定を[英語]に変更します。
このように指定を行ってから[実行ボタン]をクリックすると、ファイル毎に指定した条件により、OCRを利用した変換処理が一括で実行できます。
『瞬簡PDF 変換 7』について、詳細は製品紹介サイトをお訪ねください。
明日は透明テキスト付きPDF作成時の改善についてご説明します。

投稿者 taishii : 09:00 | コメント (0) | トラックバック
2011年10月24日
PDFをOfficeファイルに高精度変換!! 『瞬簡PDF 変換 7』 新発売
アンテナハウスでは、PDFをWordやExcelに変換して再編集可能にするソフト『瞬簡PDF 変換 7』を10月14日に販売開始しました。
先行してダウンロード版を発売し、パッケージ版は10月21日から出荷を開始していますので、このブログが掲載される頃には店頭で新しいパッケージを見ることができるかも知れません。
リッチテキストの名前が消えた!?
これまで弊社の『リッチテキストPDF』シリーズをお使いいただいていたユーザー様は、今回の製品名をみて「あれ!?」と思われたかも知れません。そうです、今回より製品名から『リッチテキスト』の文字が消えてしまいました。
『リッチテキストPDF』シリーズは2005年の6月に最初のバージョンを発売しまして、これまで何度も改良を重ねて参りました。PDFからOffice文書に変換するソフトウェアとしては、けっこう老舗の部類に入ると思います。
また、最初のバージョンは日経誌の記事"PDFをWordファイルに見事に変換「リッチテキストPDF」"にも取り上げられて、ここでお褒めをいただいたことや、ご指摘を受けたことなどが、以後の開発に随分と励みになったものです。
そのような、歴史?のある「リッチテキスト」の名称を今回使用しなかったのは、「瞬簡PDF」シリーズへの統合をより明確にするためでした。
『瞬簡PDF 変換』という命名には、ビジネスや日常で欠かせないものになってきたPDFの活用をサポートするツールとして、アンテナハウスがどのような製品を提供し、それで何ができるかを、分かりやすく明快にお客様にお伝えしたいとの思いを込めています。
「瞬簡」は、「瞬時」に「簡単」からなる造語です。「瞬簡PDF」という名称を共通に冠した弊社製品群が、この名に恥じないように、お客様のPDFご活用の一助となれば幸いに存じます。
今回の新製品では、今ご覧いただいているブログの右側を見ていただくとお分かりいただけますように、「瞬簡PDF 作成」と「瞬簡PDF 変換」のパッケージもこれまでと違って、幅の広い存在感のあるものにリニューアルしました。さらに、企業・官庁様向けに"超"お得な価格設定を新規に導入するなど、全体に力の入ったものとなっています。
さて、外側の話しはこれくらいにして、明日からは、内部でどのような改善を行ったかにつきまして、ご説明していきたいと思います。次回も是非お読みください。
投票をお願いいたします
投稿者 taishii : 09:00 | コメント (0) | トラックバック
2011年10月22日
事業所内でインストール数を管理しなくても良い事業所一括ライセンス体系を導入しました
アンテナハウスは、10月17日に、AH-ULL(エーエイチ-ユーエルエル:Antenna House-Unlimited License)という新しい企業向けライセンス体系を発表・提供開始しました。
詳しくはこちらをご覧ください。
http://www.antenna.co.jp/purchase/sitelisence.html#AH-ULL
AH-ULLは、事業所の規模に応じた価格になっており、その事業所の中ではインストール本数を気にすることなく何本でもインストールすることができるライセンスとなります。
現在、200人規模まで、500人規模、1000人規模で提供しています。たとえば、200人規模の「AH-ULL200」は、
・瞬簡PDF 作成 5 69,300円
・瞬簡PDF 変換 7 170,100円
・瞬簡PDF 作成・変換パック 182,700円
・書けまっせPDF 5プロフェッショナル 239,400円
・書けまっせPDF 5スタンダード 94,500円
・PDFサイン 151,200円
(いづれも税込み価格です)
となっています。各製品の1本単価と比較してAH-ULLは非常に割安です。それに、事業所の中でインストールした本数を管理する手間が省けますので、管理が楽になるという二重にお得なライセンスとなります。
通常、ソフトウェアのライセンス価格はインストールした枚数に単価を掛けて算出する仕組みになっています。このためにはインストールした本数をカウントして管理する必要があります。
以前、ある自治体の庁舎の中で、インストールされているソフトウェアの本数を調べたところ、購入・登録した本数と比べて数倍の本数が使われていたということで問題になったことがありました。
便利なソフトウェアは、隣が使っていれば自分も使いたくなるものですが、だからと言って自分もインストールすれば不正コピーとなります。
これを避ける方法は二つあります。(1)マイクロソフトのようにアクティベーションを管理する方法と、(2)コピー枚数をカウントしなくても良くする方法です。
アンテナハウスのAH-ULLは、(2)の考えに基づくものです。新しいソフトウェアのライセンス体系として普及させたいと考えています。
投票をお願いいたします
投稿者 koba : 10:26 | コメント (0) | トラックバック
2011年10月21日
CAS-UBのセミナー各種
昨日は、アンテナハウスのクラウド型汎用書籍編集・制作サービス「CAS-UB」を使うと、同じ原稿から、EPUB版、PDF版の電子書籍を同時並行で製作できることを紹介しました。また、PDFで入稿して印刷・製本することで、電子書籍と印刷の両方に対応した出版ができることを紹介し、この出版形態をアンテナハウスでは、「ハイブリッド出版」と呼んでいることも紹介しました。
今日は、CAS-UBのセミナーについてお知らせします。
まずは、まもなく、2011年10月26日(水)に開催する第3回CAS-UB紹介セミナー。
これは、CAS-UBの実演をして、CAS-UBがどんなものか、出版の未来がどう変わっていくかを紹介するものです。現在、開発中の最もホットなCAS-UBを知ることができます。
もちろん、参加は無料です。
参加、ご希望の方は、
CAS-UB お知らせ
にある、「第3回CAS-UB紹介セミナー開催」を、ご覧ください。
次は、実際にCAS-UBを使いながら、本を作る体験学習ができるハンズオン形式のトレーニングセミナー。
これは、無料で、毎週、開催しています。
詳しくは、
CAS-UB トレーニング・セミナー
を、ご覧の上、お申し込みください。
定員が、毎回5名と少数なので、すぐ埋まってしまいます。お申し込みは、お早めにお願いします。
先週、2011年10月12日から16日まで、ドイツのフランクフルトで行なわれたヨーロッパ最大の、本と出版に関する展示会「フランクフルト ブックフェア」に、ドイツのリセラーさんの協力でCAS-UBを出展しました。
そのときの模様は、残念ながらまだ報告が上がってきてないのですが、CAS-UBは、今後も、日本国内、海外を問わず、積極的に展示会やセミナーで紹介していきます。
ぜひ、一度、展示会のブースやセミナーで、CAS-UBを実際にご覧になり、説明を受けてください。
クラウド型汎用書籍編集・制作サービス「CAS-UB」について詳しいことは、
アンテナハウスEPUB情報ページ
や
CAS-UBのPRサイト
をご覧ください。

投稿者 taishii : 09:00 | コメント (0) | トラックバック
2011年10月20日
CAS-UBで本のEPUB版, PDF版を同時に作る
アンテナハウスのクラウド型汎用書籍編集・制作サービス「CAS-UB」については、以前、このブログでも紹介しました。
たとえば、
クラウド型汎用書籍編集・制作サービス CAS-UBを発表
にあります。
このときCAS-UBは、まだ、実験的なサービスでしたが、9月1日から正式なサービスになりました。この間、多くの方から改良点のお寄せいただき、開発チーム一同、大変に感謝しております。
いまのCAS-UBは、上記で紹介したときからは、ずいぶん変貌を遂げています。
現在の画面を出しても、また、すぐに変わってしまうので、出しません。
というのは、まだまだお客様からの要望がいくつもあり、日々、開発と改良が続いているからです。
そこで今回は、CAS-UBのマニュアルについて紹介します。
CAS-UBのマニュアルは、なんと、開発の初期の段階から、CAS-UB自体で執筆し、製作しています。
CAS-UBを使うと、同じ原稿から、簡単に、EPUB版とPDF版の本を作ることができます。つまり、EPUB版とPDF版を同時並行で製作できるのです。さらに、PDFで入稿して印刷することで、紙の本も作れます。
電子書籍と印刷の両方に対応した、この出版形態をアンテナハウスでは、「ハイブリッド出版」と呼んでいます。
CAS-UBのマニュアルもそうやって、EPUB版とPDF版を作っています。
CAS-UB 関連資料集にある「CAS-UB マニュアル」をご覧ください。
そこに、スタートアップ・ガイド、チュートリアル、ユーザー・ガイドのそれぞれについて、EPUB版、PDF版があります。自由にダウンロードできますので、ぜひ、ダウンロードして、中身をご覧ください。
スタートアップ・ガイド
CAS-UB「ユーザー登録から退会処理まで」(EPUB形式)
CAS-UB「ユーザー登録から退会処理まで」(PDF形式)
チュートリアル
CAS-UBチュートリアル(EPUB形式)
CAS-UBチュートリアル(PDF形式)
ユーザー・ガイド
CAS-UBユーザー・ガイド(EPUB形式)
CAS-UBユーザー・ガイド(PDF形式)
開発チームとして注目していただきたい点は多々ありますが、やはり、目次、注釈一覧、図表一覧、索引といったものが、自動的に作られていることです。
日本の本、特に新書では、索引がないものが多く、読者からは、編集者、著者の怠慢と指摘されています。CAS-UBを使えば、このように簡単に索引が作れるのです。ぜひ、活用していただきたいと思います。
もう1つ、注目していただきたいのは、テーマによって、がらりと違う雰囲気のEPUBが作れることです。
CAS-UB 関連資料集にある「CAS-UBで作成したPDFとEPUB」をご覧ください。
次の2つは、同じ原稿から、テーマを切り替えることで、見栄えだけを変えて作ったものです。印象が全然違うことがおわかりいただけると思います。CAS-UBでは、これが、簡単にできるのです。
CAS-UBで作成したEPUBのサンプル(1)テーマ:オルディーズ(EPUB)
CAS-UBで作成したEPUBのサンプル(2)テーマ:グリーン(EPUB)
なお、Adobe Digital Editionsでは、「テーマ:オルディーズ」が正しく表示されません。Firefoxのアドオン、
EPUBReader
で、ご覧ください。
同じ原稿から作ったPDF版と見比べるのも、面白いかもしれません。
CAS-UBで作成したPDFのサンプル(PDF)
クラウド型汎用書籍編集・制作サービス「CAS-UB」について詳しいことは、
アンテナハウスEPUB情報ページ
や
CAS-UBのPRサイト
をご覧ください。

投稿者 taishii : 09:00 | コメント (0) | トラックバック
2011年10月19日
PDFからのテキスト抽出で困っていること
昨日は、TextPorterがさまざまなソフトのファイルからテキストを抜き出してくるソフトであること。一般の人の目に触れないところで、実は、数多く採用され、活躍していることをお話しました。
そのTextPorterを使ったPDFからのテキスト抽出で、最近、困ったことが起きています。
1つ目は、壊れたPDFが氾濫していることです。
PDFは、Adobe社が独自に開発したものですが、仕様はすでに、
PDF Reference and Adobe Extensions to the PDF Specification
として、公開されています。また、ISO 32000という国際規格にもなっています。
規格に沿ったPDFであれば、TextPorterは困らないのですが、世の中には、規格を逸脱したPDFがたくさんあります。
お客様から、このPDFからテキストが抽出できないという問い合わせがあり、調べてみると、規格に準拠してない、壊れたPDFであることがほとんどです。
それらは、オープンソースのPDFライブラリや自作の独自ライブラリを用いて作られたものが多いようです。そのPDFライブラリのバグなのか、そのPDFライブラリを使うプログラマのレベルが低くて、バグを入れてしまっているのかは、定かではありません。とにかく、壊れた汚いPDFがあちこちで流通してしまっているのが現状です。
中には、Adobe Readerでも表示できなかったり、Adobe Readerがハングアップしてしまうものまであります。
TextPorterは、なるべくテキストを抽出しようとがんばってはいますが、自ずと限界はあり、壊れ方がひどいと、どうしようもありません。
出来の悪いプログラマが作るPDFには勝てません。どうか、プログラマのみなさん、仕様書を読んで、まともなPDFを作ってくださいと願うばかりです。
2つ目は、画像ばかりのPDFからは、テキストが抽出できないということです。
お客様から、このPDFからテキスト抽出ができないと送られてきたPDFが、実は、テキストは1文字も入っておらず、全ページが画像のPDF。つまり、スキャナで紙の書類を画像として取り込んでPDFにしたものだったというケースが増えています。
技術知識のない一般のお客様の場合、Adobe Readerで見て文字が読めるのだから、テキストが抽出できると思ってしまわれるようですが、そうなりません。実は、TextPorterは、画像認識をしてまでテキストを抽出しようとはしていないのです。
これには理由があって、画像認識までして文字列を抽出しようとすると、処理スピードの低下など、あれこれ弊害が出てしまうからです。TextPorterは日夜、膨大な数のファイルからテキスト抽出をする用途に使われているので、処理スピードの低下は、大きな問題になるのです。
ハードウェアの性能がもっと向上すれば、挑戦すべきテーマとは思いますが、現在のところ、そこまでやることは控えています。
画像ばかりのPDFからは、テキスト抽出はできない。これを覚えておいていただきたいと思います。
TextPorterについての詳しい説明は、
TextPorter
をご覧ください。
TextPorterをはじめ、アンテナハウスのシステム製品につきましては、事前に技術相談会を行っております。お気軽にお問い合わせください。
詳しくは、
システム製品技術相談会
をご覧の上、お申し込みください。

投稿者 taishii : 09:00 | コメント (0) | トラックバック
2011年10月18日
サーバ組込用テキスト抽出エンジンTextPorter
TextPorterは、クラウドコンピューティング時代のサーバ組込用テキスト抽出エンジンです。
何ができるかを一言でいうと、Word, Excel, PDFなど色々なアプリケーションのファイルから文字列を抜き出してくるソフトです。
「ファイルから文字列を抜き出してくるだけなのに、そんなに大変なことなの?」と思われるかもしれませんが、世の中には、実に数多くの種類のファイルがあり、そこから文字列を抜き出すだけでも、けっこう大変な仕事です。
ファイルの解析から始め、テキスト部分がどこかを探り当て、それを抽出するプログラムを書いて、いろんなケースをテストして製品の完成度を高めないといけません。
TextPorterが対応しているファイル形式の一覧「抽出対象ファイル形式」をご覧いただくとおわかりのように、これだけのファイルに対応するのは、一朝一夕ではできません。アンテナハウスが長年にわたって開発を続け、蓄積してきた成果なのです。
「大変なのはわかった。でも、テキストが抽出できると何がうれしいの?」と思われるかもしれませんが、この技術は、検索エンジン、ウィルス対策ソフト、ドキュメント管理システムなど、さまざまな用途に使うことができるのです。
システム開発をする人が、サーバに組み込んで使うソフトなので、直接、一般の人たちの目には触れませんが、縁の下の力持ちとして、大いに役立っているソフトなのです。
採用事例は数多くあり、世界的なソフトウェアやサービスにも組み込まれていますが、契約の関係上、採用事例をご紹介できるのは、次の事例です。
採用事例(ケーススタディ)
のあるように、エヌ・ティ・ティ アイティ株式会社(NTT-IT)様のInfoBeeにご採用いただいております。
ほかにも、
スマートフォンでの活用 互換性 Server Based Converter
にあるような活用法も考えられます。
TextPorterについての詳しい説明は、
TextPorter
をご覧ください。
TextPorterをはじめ、アンテナハウスのシステム製品につきましては、事前に技術相談会を行っております。お気軽にお問い合わせください。
詳しくは、
システム製品技術相談会
をご覧の上、お申し込みください。
最近、PDFからテキスト抽出をするときに困っていることが起きているので、明日は、それについて書いてみます。

投稿者 taishii : 10:01 | コメント (0) | トラックバック
2011年10月17日
AH Formatterの強い味方「XSL Report Designer」
アンテナハウスのAH Formatterは、世界各国で使われ、高い評価を得ています。最近では、「米国国税庁でAH Formatter 案件が進む」にあるように、アメリカの国税庁(IRS)でも採用されました。
このように大変優秀なソフトですが、レイアウトを決めるには、XSL-FOとXSLTの知識と経験が必要です。
習得すると、思い通りのレイアウトができますが、習得には時間がかかります。
そこで、登場するのが、「XSL Report Designer」です。
XSL Report Desingerを使うと、GUIの画面で、簡単に帳票のレイアウトを設計できます。
設計したレイアウトとXMLのデータを組み合わせて、XSL-FOを生成して、AH FormatterでPDFにしたり、印刷したりできるようになるのです。
どういうレポートが設計できるかは、
XSL Report Designer レポート設計サンプル
をご覧ください。
AH Formatterを活用するソフトとして、XSL Report Designerは、海外でもご好評をいただいています。
以前、通貨の出力を、ヨーロッパで使う形式、つまり、小数点を「,」、3桁の区切りを空白にできるかという質問がありました。
たとえば、「1,234.56」ではなく、「1 234,56」で出力したいという要望です。
XSL Report Designerは、国際化対応をしていますので、この要望にもお応えすることができました。
XSL Report Designerについての詳しい説明は、
XSL Report Desinger
をご覧ください。

投稿者 taishii : 09:33 | コメント (0) | トラックバック
2011年10月14日
スマートフォンでの活用 セキュリティ Server Based Converter
iPhon4S発売されましたね。銀座のアップルストアでは、先頭に並んだ人が「火曜日から」とTVで言っていました。また、EM(イー・モバイル)からは、最小のスマートフォンも発表されましたね。色々と話題に事欠かないスマートフォンですが、ビジネス向けに考えた場合には欠かすことができない「セキュリティ」に関して考えてみたいと思います。
セキュリティのアプローチとしては、「端末」側と「サーバ」側での実装が考えられます。
- 「端末」側
- ロックをかける
- 表示ファイルを残さない
- 盗難、及び紛失時の対処
- 「サーバ」側
- 接続端末の選別
- ログイン・ユーザの選別
- アクセスできるファイルの選別
それぞれ、「アプリ」で対応でき色々な方法で実現できますが、「なりすまし」を防ぐのは難しく、完全に流出を防ぐことはできないのではないかと思われます。
そこで、4番目の対応です。
Server Based Converter にて、端末側からの要求ファイルに、「透かし」を入れてみてはどうでしょうか?
「社外秘/Confidential」「アクセス日時」「所属」「氏名」等を入れることにより流出元の特定にも役立ち、且つ、透明度を指定をすることができますので、文書の視認度も損なわずに済みます。
さらに、もう一段セキュリティを設けるとすれば、
- 画像(JPEG/PNG)へ「透かし」入りで変換
- 「1.」をユーザパスワード、及びPDFの各種セキュリティ付きPDFを作成
をしてしまうことのより、より強固に保護することができます。
上記は、一例ですが、Server Based Converter を使用することにより、使用感を損なわないでセキュリティをより強固にすることができますので、是非一度ご検討の上お試しください。
最後に、Server Based Converter の機能強化の予定として、「ユーザパスワード付きのMicrosoft Officeファイルへの対応」を検討しております。まだまだ、この機能を実装したバージョンのリリース日をお伝えすることはできませんが、この機能を実装することにより、変換元ファイルと同じパスワードでPDFを作成することも可能となり、自然災害など予期せぬ自体が発生し、パスワードを知る人がいなくなった場合においても、諦めることなく文書資産を生かせることができるようになります。
・Server Based Converter
・Server Based Converter デモサイト1(PC用、サムネイル作成)
・Server Based Converter デモサイト2(透かし対応)

投稿者 john : 17:41 | コメント (0) | トラックバック
2011年10月13日
スマートフォンでの活用 互換性 Server Based Converter
PC並の性能を持ち始めている、と言いますか、ある種PCよりも利便性に長けているスマートフォン、欲しいですね。個人での購入であれば、仕事に打ち込み成果を得るか、何かを節約して購入することも可能ですが、大企業や中小企業でもビジネスで一括に大量購入するとなると、かなり難しいのではないかと思われます。
となると、段階的に購入することとなり、社内のシステムや利用しているサービス等は一世代前の携帯電話との互換性が求められてきます。
そこで、 Server Based Converter 及び、弊社他製品を利用してスマートフォンと一世代前の携帯電話と互換性のあるシステムを考えたいと思います。
携帯電話向けのシステムやサービスでは、接続している機種が型番までわかると思います。その情報を利用して
- 一世代前の携帯電話に関しては、低解像度のラスターを作成してブラウザ表示する。
- スマートフォンに関しては、高解像度のラスターを作成してブラウザ表示する。
- 上記2つに当てはまらない世代の携帯電話には、 TextPorter を利用しテキスト化してブラウザに表示する。
非常に簡潔に記載しましたが、ラスター(JPEG/PNG/TIFF/MTIFF)化以外にも Server Based Converter ではPDFやFlash(SWF)、SVGに変換できますので、次世代スマートフォンへの対応も視野に入れることができると思っております。
・Server Based Converter
・Server Based Converterデモサイト1(PC用、サムネイル作成)
・Server Based Converterデモサイト2(透かし対応)
投票をお願いいたします
投稿者 john : 17:24 | コメント (0) | トラックバック
2011年10月12日
スマートフォンでの活用 処理速度 Server Based Converter
普及率が年々伸びてきているスマートフォン。皆さんでもお使いになっている方がいるのではないでしょうか。
一昔前の携帯電話には、PDFやMicrosoft Officeファイルをそのまま表示できるViewerが搭載されている物もありましたが、あまりにも「遅く」、結果、「使えない」と言って使用を断念された方もいらっしゃるのではないでしょうか。
スマートフォンでもアプリとしてViewerが標準搭載されている場合があり、且つ、有償/無償共に様々なViewerアプリを使用することができます。ただ、「遅い」問題や、ネットワークを通じてのファイル転送にも限界が有るようで、ビジネスでそのまま使用することは難しい状況です。
そのような場合に、Server Based Converter を使用していただくと様々なアプローチで端末側の処理速度問題を解決する事が可能です。
- ラスター化
JPEG/PNG化して搭載しているブラウザで表示させる。
もっともお手軽に実現できる方法と思われます。
Server Based Converter では、ファイルをページ毎に出力することもできますので、サムネイル表示後、必要なページだけ端末側で表示することも可能です。
ただし、解像度を上げすぎると比例してファイル容量も大きくなりますのでネットワークの負荷も大きくなります。 - ベクター化
SVG/SVG Tiny化し、スマートフォン側でSVG/SVG Tiny用Viewerで表示する。
Viewerアプリを作成、配布する事が前提となってしまいますが、処理の速さやベクターデータならではの拡大縮小自在の見やすさは、ラスターデータにないはものです。
Viewerアプリ側でgzip圧縮対応もしている場合は、Server Based Converter でgzip圧縮したSVG/SVG Tinyファイルをページ毎に出力できますので、ネットワークへの負荷も下げることができます。
- PDF化
PDF化し、スマートフォン側でPDFViewerで表示する。
ブラウザに迫る勢いで標準搭載されてきていると思われるPDF用Viewer。
Server Based Converter でファイルをページ毎に出力もできますが、Viewer側で「リニアライズ処理(Web形式に最適化)」に対応することにより、Server Based Converter で出力したPDFを弊社別製品のPDFToolにて「リニアライズ処理(Web形式に最適化)」されたファイルを出力すれば、複数ページのPDFもページ毎に読込できるようになります。
また、様々なPDFで対応しているセキュリティオプションもServer Based Converter で指定することができますので色々なシーンで活用できるようになります。
Server Based Converter は残念ながらスマートフォン(iPhon/Android)対応していないので、端末側で動作することはできませんが、サーバ側で稼働している既存の文書管理やグループウエア等に組み込む事により、よりいっそう快適な使用感を付加することが可能です。
是非ご検討ください。
・Server Based Converter
・Server Based Converterデモサイト1(PC用、サムネイル作成)
・Server Based Converterデモサイト2(透かし対応)
投票をお願いいたします
投稿者 john : 17:18 | コメント (0) | トラックバック
2011年10月11日
スマートフォンでの活用 Server Based Converter
iPhonやAndroidで話題のスマートフォン。多機能で通常業務にて使用しているMicrosoft Officeファイルをそのまま使えるアプリもたくさん出ているようですが、ビジネスシーンでの利用はまだまだ浸透していないようです。
なぜ?と思い色々と調べてみました所、以下のキーワードが浮かんできました。
<キーワード>
1)処理速度
2)互換性
3)セキュリティ
大まかには上記の3つです。どれもネット時代にはありきたりなキーワードですが、その分根が深い問題なのだとあらためて実感しましました。
明日より3回にわたり、上記キーワードに関して、Server Based Converterでどのように解決していくかをご紹介させていただきます。
・Server Based Converter
・Server Based Converterデモサイト1(PC用、サムネイル作成)
・Server Based Converterデモサイト2(透かし対応)

投稿者 john : 17:38 | コメント (0) | トラックバック
第3回CAS-UB紹介セミナーを10月26日開催!
10月26日(水曜日)18:30より20:30まで、第3回クラウド型汎用書籍編集・制作サービス「CAS-UB」紹介セミナーを開催します。
CAS-UBで、実際に書籍を作るところを実演します。また、現在開発中の、EPUB3、数式編集、英語版などの新しい機能についてご紹介します。
場所は市ヶ谷健保会館 F会議室。
東京都新宿区市谷仲之町4-39
参加費は無料ですが、事前登録が必要です。
○お申し込みはこちらからどうぞ。
http://www.exism.co.jp/contact/form/seminarinq.html
○詳細ご案内
http://www.cas-ub.com/info/index.html

投稿者 koba : 07:51 | コメント (0) | トラックバック
2011年10月07日
Antenna House Formatter V6 で floatを使った図版の最適配置
日本語組版の規格として、JIS X4051(日本語組版規則)があります。
ここにある規格書の、X4051 02 のPDFを閲覧すると、97ページあたりから 図・写真等の処理について説明があります。Antenna House Formatter V6 では、このPDFにある、図49、図50の配置を行なう機能を実装しています。
以下がそのサンプルです。解りやすくアンカー位置を赤丸印で示しています。
データの float の指定は3つとも同じですが、その出現位置によってこのように3パターンの配置を実現しています。
どうぞ実際に、Antenna House Formatter V6 を使ってみてください。
評価版のダウンロードは、こちら から。

投稿者 AHEntry : 09:50 | コメント (0) | トラックバック
2011年10月06日
Antenna House Formatter での異体字の使用
本日は、度々お問い合わせのある、Antenna House Formatterでの異体字の使用についてお話しします。
異体字とは
・同じ意味/発音を持っているが、異なる表記の字体の文字
・新字と旧字による違いや、手書きによる個人差から生じたものなどもある
・人名や屋号、地名に多く使われる
JISやUnicode仕様においては、基本的に異体字ごとに異なるコードを割り振るようなことは行っていません。(ただし例外もあります)
Unicodeでは異体字セレクタという名称でタグを付けることにより、先行する一文字と組み合わせて定義付けされた字体を選択する方法をとります。
2006年1月13日に漢字で異体字セレクタを使うための漢字字形データベース(Ideographic Variation Database)への登録手続きが定められ、2007年12月14日に最初の異体字コレクションとしてAdobe-Japan1が登録されました。
Antenna House Formatterはこの異体字に対応しています。
異体字選択機能を持っているCIDフォント(OpenTypeフォント)と組み合わせて使うことで、Antenna House Formatter から、PDFへの異体字出力が可能です。(PDF出力のみ、他の出力オプションは未対応)
Antenna House Formatter での使用方法
Antenna House Formatterで、これらを使うには次のようにします。
例えば、葛飾区と葛城市の「葛」には、二つの字形があります。
どちらの文字も、U+845Bという符号位置に統合されています。
異体字セレクタを使って、次のように区別することができます。
1. U+845B U+E0100
2. U+845B U+E0101
XSL-FOでは、次のように書きます。
<fo:block>葛󠄀</fo:block>
<fo:block>葛󠄁</fo:block>
これを小塚明朝 Pr6N フォントを使用した場合、出力は次のようになります。
皆さんも試してみてください。

投稿者 AHEntry : 12:12 | コメント (0) | トラックバック
2011年10月05日
Antenna House Formatter V6 のルビ機能
Antenna House Formatter V6 ではルビ機能について拡張し、
使いやすく、正しい表現が可能になりました。
Antenna House Formatter V5 までは、ルビを直接表現できなかったため、fo:inline-container などを利用して模倣せざるを得ませんでした。そのためルビの配置や行分割に対して多くの制約がありました。
Antenna House Formatter V6 で実装されたルビ拡張では、このような制約を取り払い本来のルビを表現できるようになりました。
ルビ機能を使ったサンプルをご覧ください。
ぜひ、これらの機能をお試しください。
Antenna House Formatter V6 の評価版のダウンロードはこちらから。
明日もAntenna House Formatter V6 のお話が続きます。
投票をお願いいたします
投稿者 AHEntry : 10:49 | コメント (0) | トラックバック
2011年10月04日
Antenna House Formatter V6 を米国国税庁が採用!
本日も、9月30日にリリースとなった、世界標準の自動組版ソフト Antenna House Formatter V6 についてです。
以前にもお話しましたが、Antenna House Formatter V6 は、米国の国税庁の新しいPDF配布ページに採用されました。
プロジェクトでは、ページ組版の多くの要求仕様がリストアップされていました。
次のようなものです。
・Open Type Fonts に対応
・マルチバイト言語に対応
・TaggedPDF出力機能
・XSLT, XSL-FOに対応
・Logファイルを生成する
・4つのカラムをサポート
・ヘッダ、フッタ機能
・段組ページの上か下または隅に段を跨るフロート配置
・ページや段の任意の位置へのフロート配置
・フットノート機能
・改定バーの代わりに任意の文字を置く機能
・カラムのバランス機能
・ハイフネーション機能
・インデックス機能
・水平、垂直アライメント機能
・PDFを画像としてPDFに埋め込む
・行折り返し時のインデント位置指定機能を追加
・AcroForm による記入欄のあるPDFを埋め込み
:
などなど。
これらの多くは既に実装済みでしたが、不足している機能もありましたので、それらを実装することで採用となりました。Antenna House Formatter V6 では、これら多くの要求を満たす充実した機能をご利用いただけます。
ぜひ、Antenna House Formatter V6 の評価版をお試しください。ダウンロードはこちらから。
明日も Antenna House Formatter V6についての話です。

投稿者 AHEntry : 16:41 | コメント (0) | トラックバック
2011年10月03日
世界標準の自動組版ソフト Antenna House Formatter V6 新発売!
かねてよりブログなどで報告させていただいておりました、自動組版ソフトの新版 Antenna House Formatter V6 を 9月30日にリリースいたしました。
今回の新版では、float機能の強化によって、従来は難しかった図版の自由な配置を実現しました。
ページの指定位置に floatを配置したり、段組の中に float を配置したり、段組中を通しで float を配置したりすることができます。
色々な指定をしたfloat機能のサンプルをご覧ください。
・バージョンアップについて
現在 Antenna House Formatter V5 をお使いのユーザー様は、Antenna House Formatter V6 に無償バージョンアップしていただけます。
無償バージョンアップの条件などにつきましては、こちらをご参照ください。
バージョンアップをご希望されるユーザー様は、
弊社保守サービス:hosyu@antenna.co.jp宛に、ユーザIDとシリアル番号を記述し、V6へバージョンアップ希望と書いてメールにてご連絡ください。
なおバージョンアップの場合、ご依頼から発送まで一週間程度のお時間がかかりますので、よろしくお願いいたします。
明日も引き続き、Antenna House Formatter V6についてお話します。
投票をお願いいたします