カテゴリー別アーカイブ: コラム

『AH PDF Server V3』の新しい改訂版が出ました。

 10月末に「AH PDF Server V3」の新しい改訂版がリリースされました。今週は少し改訂版にからめて新しい機能について書こうと思います。

 新しい改訂版についての内容はこちらになります。
https://www.antenna.co.jp/support/update-sys/psv/psv30.html

 今日は新しくプロフェッショナル版とコマンド版に追加された「AH PDF Server V3 コマンドGUI」について簡単に紹介します。

 「AH PDF Server V3 コマンドGUI」は PDF Server のコマンドラインプログラムの設定と実行テストが出来るようにしたWindowsアプリケーションです。コマンド版ではデスクトップ上に「AH PDF Server V3 コマンド」とショートカットが作成されます。プロフェッショナル版ではスタートメニューの「すべてのプログラム」→「Antenna House PDF Server V3」→「PDFServer V3 コマンド」で起動できます。

コマンドGUI画面

 「AH PDF Server V3」にはいくつか設定がありますが、そのうちシステム全体の設定を行う「PDF Server 設定」というのがあるのですが、これは「コントロールセンター」から設定が可能になっています。しかし、コマンド版には「コントロールセンター」は使用できないために実装されていません。そのため、サポートに寄せられたお問い合わせの中でコマンド版を使用していて「PDF Server 設定」の変更が必要なケースは設定方法をその都度ご案内してきました。

 しかし、いつまでもそのままにしておく訳にも行かなかったので今回、「PDF Server 設定」が簡単に行えるようにGUIプログラムを提供する事としました。GUI左上の「設定」というグループがそれに該当します。コマンド版では「PDF Server 設定」のうち、この3項目のみが利用されています。

 また、設定の下にはコマンドラインプログラムの実行を簡単に行う事が出来るようにしてあります。コマンドラインプログラムは実際の運用では他のプログラムから呼び出される事になると思いますが、最初はおそらくコマンドプロンプトかPowerShellを開いてコマンドを入力して動作を確認していると思います。「AH PDF Server V3 コマンドGUI」ではその最初の確認が容易に行えるようにチェックボックスやドロップダウンリストなどで設定して「実行」ボタンをクリックするだけでコマンドラインプログラムを起動して実行できます。もちろん、「実行パラメータ」に手動でパラメータを打ち込んでも実行出来て結果を別ウィンドウでステータスコードと共に確認する事が出来ます。

コマンド実行コンソール画面

 「実行パラメータ」の内容はコマンドラインプログラムの実行時にチェックしていないので、空のまま実行する事も出来ます(その時は結果の所にヘルプが表示されます)。GUI上では排他設定になるものは自動的に無効になったり、実行パラメータにすぐに反映されるため正しいパラメータが簡単に確認出来るので実際の運用時に間違う事が減ります。お問い合わせの中でもパラメータの間違いと言うものが思いの外多いのも事実ですので、こちらで確認してもらえればと思います。

 「AH PDF Server V3 コマンドGUI」は初期リリースの頃にはすでに開発されていました。元々は開発時にテストが簡単に行えるように考えられたものですが、最近はフォルダ監視よりもコマンドラインプログラムを利用のユーザー様が多く、問い合わせ内容等を考えると意外に有用性も高そうなので今回少しだけ体裁を整えてリリースしました。

 まずはお試し頂ければと思います。

AH PDF Serverについて、詳細情報は製品ページをご確認ください。
また、評価版もWebページからダウンロード可能です。ぜひお試しください!
評価版お申込みページ

製品についてのお問い合わせ:
アンテナハウス株式会社システム営業までどうぞ。
TEL:03-5829-9021 e-mail:sis@antenna.co.jp


「瞬簡PDF タッチ」 最新アップデート情報

「瞬簡PDFタッチ -かんたん手書き入力-」は本日、最新版バージョン1.0.6を公開しました。

今回のバージョンアップは不具合の修正がメインとなりますが、すべて重要な内容となっておりますので必ずアップデートしていただくようお願いいたします。

追加/修正内容

  • 特殊なPDF注釈オブジェクトを表示できるようにしました。
  • 純粋なPDFを開いて保存をし続けるとファイルサイズが増え続けることがある問題を修正しました。
  • アンドゥで手書きオブジェクトをすべて削除した後、保存すると異常終了することがある問題を修正しました。

最新バージョン1.0.6は下記URLからダウンロードすることができます。
https://www.antenna.co.jp/support/update/pdftouch/pdftouch10.html

 


「瞬簡PDFタッチ」のWindows8.1対応について

「瞬簡PDFタッチ -かんたん手書き入力-」はタッチ操作と手書き入力に対応したPDF書き込みツールです。
タッチ操作で位置を決め、そのまま切り替えなしでシームレスにペン入力することができます。

先日発売されたWindows8.1での動作確認が遅れておりましたが、本日、動作確認済みとなりました。
Windows8以前のOSと同様に問題なくお使いいただくことができます。
「瞬簡PDFタッチ」のウリであるタッチ操作とペン入力が切替なしでできる機能も引き続きご利用いただけます。

動作確認は最新のバージョン1.0.6での確認となっております。
バージョンを確認するには「瞬簡PDFタッチ」を起動後、「アプリケーションボタン」を押してメニューから「バージョン情報」を選んでください。
バージョン番号が1.0.6より古い場合は改定情報ページよりアップデータファイルを取得して、アップデートをおこなってください。

なお、その他デスクトップ製品のWindows8.1対応状況については下記ページでご確認ください。
ほとんどの製品が動作確認済みとなっております。
PDFデスクトップ関連製品 Windows 8.1 での動作確認状況


Windows8.1とPDFリーダーについて

つい先日Windows8.1がリリースされ、Windows8からの無料アップデートも開始されました。

弊社デスクトップ製品のWindows8.1対応状況については下記ページでご確認いただくことができます。
PDFデスクトップ関連製品 Windows 8.1 での動作確認状況

「瞬簡PDFタッチ」はまだ動作確認が完了しておりませんが、近日中に検証をおこない、結果を公開いたしますのでもうしばらくお待ちください。
なお、Windows8であった問題、「瞬簡PDFタッチで出力したPDFの手書き文字が、Windows8標準のPDFリーダーで表示されない」問題は、Windows8.1でもそのまま放置されているようです。
このバグが今回のリリースで修正されることを期待していましたが残念です。

今回はこのWindows標準のPDFリーダーについて少し触れたいと思います。
Windows8から搭載されたこの標準PDFリーダーはMetroスタイルのアプリケーションで、フルスクリーンでの表示とタッチ操作を前提に設計されています。

そのため通常のデスクトップアプリケーションとの親和性は高くなく、PDFを表示させながら他のアプリケーションを使うという操作がやりずらい面があります。
しかしそれ以前に、PDFの表示機能自体に多くの問題が見つかっています。
例えばリンクが機能しないことがある、一部PDFの描画がおかしい、添付ファイルが表示できない、一部注釈の表示がおかしい(そもそもリンク注釈は表示自体がされない)、レイヤーに未対応など、問題が多く、海外の掲示板などをみてもあまり評判はよくないようです。
標準のPDFリーダーとして使うにはまだ時期尚早といったところでしょうか。
これらの問題がOSのアップデートにより少しでも改善されていくと良いのですが、今回のWindows8.1のような大きなアップデートでも変わらないところを見ると、今後も望み薄なのかもしれません。

 


TextPorterのWindows 8.1、Windows Server 2012 R2対応について

 TextPorterは、サーバ組込用のテキスト抽出エンジンで、Word, Excel, PDFなど色々なアプリケーションのファイルから文字列を抜き出します。

 TextPorterは、Windows 8.1、Windows Server 2012 R2に対応するかというお問い合わせを頂戴しています。
 TextPorterは、Windows 8.1、Windows Server 2012 R2に対応いたします。
 時期につきましては、Windows 8.1、Windows Server 2012 R2の正式版出荷後、1ヵ月ほどを予定しております。
 Windows 8.1、Windows Server 2012 R2の正式版出荷時の最新版(現在の最新版は、V5.3 MR2ですが)で、テスト、動作確認を行ないます。
 もし、問題が起きたときは、改良を加えて、MRとしてリリースする予定です(V5.3 MR2で問題が発生したときは、V5.3 MR3としてリリーする予定です)。
 動作保証ができる段階になれば、その旨、ウェブなどでお知らせいたします。
 いずれにしましても、最新バージョンの最新MRで、Windows 8.1、Windows Server 2012 R2に対応することになります。

 なお、最新版以前のバージョンにつきましては、まことに勝手ながら動作保証の対象外とさせていただきたく存じます。
 どうしてもいう場合は、弊社にお問い合わせ下されば、善後策を協議することができると考えております。
 よろしくお願いいたします。

 TextPorterについての詳しい説明は、
 TextPorter をご覧ください。
 
 評価版もご用意しております。
 TextPorter 評価版のお申し込み から、お申し込みください。

 アンテナハウスのシステム製品につきましては、事前に技術相談会を行っております。お気軽にお問い合わせください。
 詳しくは、
 アンテナハウス システム製品技術相談会
をご覧の上、お申し込みください。


Server Based Converter V5.0 改訂第2版(MR2)をリリース

 Server Based Converterをお使いのお客様で、弊社と保守契約を結んでいらっしゃるお客様には、バグ修正を行ったメンテナンスリリース(MR)を配布しております。
 現在、Server Based ConverterのV5.0 改訂2版(MR2)のリリースを予定しております。
 原稿執筆時点では、まだダウンロードが可能になっておりませんが、2013年10月8日から、ダウンロード可能になる予定です。
 保守契約を結んでいらっしゃるお客様で、該当するバージョンをお持ちの方は、ダウンロードして、お試しください。

 なお、他のバージョンにつきましては、今回、メンテナンスリリースはございません。
 以前、お知らせしました通り、
・最新版につきましては、従来通り、おおよそ3ヵ月に1回、年4回を目安とした配布。
・最新版以外のバージョンにつきましては、おおよそ半年に1回、年2回を目安とした配布
と、変更させていただいております。
 何卒、ご了承くださいますよう、お願い申し上げます。

・V5.0 改訂第2版(MR2)
改訂内容は、https://www.antenna.co.jp/support/update-sys/sbc/sbc50.html#v50mr1を、ご覧ください。
ダウンロードは、https://www.antenna.co.jp/sbc/user_V50mrdl_in.htmlから、行なってください。

 以前のバージョンの改訂情報は以下の通りです。

・V4.0 改訂第4版(MR4)
 改訂内容は、https://www.antenna.co.jp/support/update-sys/sbc/sbc40.html#v40mr4を、ご覧ください。
 ダウンロードは、https://www.antenna.co.jp/sbc/user_V40mrdl_in.htmlから、行なってください。
・V3.1 改訂第5版(MR5)
 改訂内容は、https://www.antenna.co.jp/support/update-sys/sbc/sbc31.html#v31mr5を、ご覧ください。
 ダウンロードは、https://www.antenna.co.jp/sbc/user_V31mrdl_in.htmlから、行なってください。
・V3.0 改訂第10版(MR10)
 改訂内容は、https://www.antenna.co.jp/support/update-sys/sbc/sbc30.html#v30mr10を、ご覧ください。
 ダウンロードは、https://www.antenna.co.jp/sbc/user_V30mrdl_in.htmlから、行なってください。

 Server Based Converterは、Microsoft Office, PDFなどのファイルを、PDF, Flash, SVG, 各種画像形式にダイレクトに変換する変換エンジンです。
 ダイレクト変換の意味は、たとえば、Microsoft Officeがない環境でも、ファイルさえあれば、それをダイレクトに内容を見える形式に変換できるのです。ダイレクト変換には、Microsoft Officeのライセンスも不要です。
 Server Based Converterは、ダイレクト変換というユニークさが評価され、多くのウェブサービス、パブリッククラウド、プライベートクラウドなどで利用されています。

 Server Based Converterに関する詳しい情報は、
https://www.antenna.co.jp/sbc/
を、ぜひ、ご覧ください。
 評価版もご用意しております。
 サーバベース・コンバーター 評価版のお申し込みから、お申し込みください。

 アンテナハウスのシステム製品につきましては、事前に技術相談会を行っております。お気軽にお問い合わせください。
 詳しくは、
アンテナハウス システム製品技術相談会
をご覧の上、お申し込みください。


続・OCRのよもやま話(2)

以前の記事『OCR技術の活用』で、OCR技術は文字の誤認識が避けて通れないということを説明しました。
また、その際に「これまで人の手で時間をかけて行っていたことも、コンピューターにまかせられるところは上手に利用して、人間でなければできない別のところに時間とエネルギーを使うのがOCR技術の賢い使用方法だと思います。」という感想を書きました。
OCRは弱点があるにしても、ソフトウェア技術として利点を活かしながらうまく利用することで強力なツールになる、という思いがあったからでした。

人力OCR!?

ところが世の中の動きは必ずしもそうではないようで、なんとOCRを「人力」で行うサービスというのがあるようです。

OCRを使った商品の代表的なものというと名刺管理ソフトが思い浮かびますが、これはスマートフォンやスキャナで取った名刺やその他の画像を専用サービスのサイトに送るとオペレータがその画像から文字を読んでテキストデータとして入力し結果を返してくれるというもので、もちろん認識率は並み居るOCRソフトを凌駕したものになります。

「OCRを人力で!?」と聞くと、OCRがソフトウェアの技術だと思い込んでいる私には寝耳に水なのですが、これを手書きの書類をコンピューターに入力するような代行サービスの一種だと考えると、以前からある話しで何のことはないですね。
ただ、これらのサービスが現代風に感じるのは、名刺などをスマートフォンに搭載されたカメラで撮影して専用アプリでクラウドに送信し結果をEvernoteなど別のクラウドサービスで受け取るようになっていること、入力代行しているオペレータが時には中国など遙か海の向こうで作業をしているといったグローバルな仕組みで提供されるというところです。

こういったサービス自体は数年前からWeb上などでも紹介されているので今頃驚いているのが恥ずかしいのですが、考えてみるとこれはOCRの「文字認識率が完全にはならない」というネガティブな点を補う意味で理にかなった利用法であると思えます。

おそらくこの仕組みでは、ユーザーから送信されたデータを一から打ち直すことなどしないで、ある程度はOCRソフトで変換を行った上で誤認識している部分を目視で確認して修正するみたいなことをしているのだと思います。そうすると、「人間でなければできないところ」を補って結果として100%の認識率を実現しているのですから理想的な利用法といえます。

名刺に限らず手書き文字でもOKなようですから、そういったデータをデジタルで管理したい方には利用価値があるかも知れません。
弱点は、人手を介することで利用状況によっては結果が返るのに時間がかかる場合があることだそうです。
お隣りの中国では経済発展の結果として人件費が高騰しつつあるということですから、今後のサービスの行方も気になります。

※『瞬簡PDF 変換8』、『瞬簡PDF OCR』は製品の体験版を公開しております。是非、お試しください。


続・OCRのよもやま話

先日、JR東海から2027年度に開業が予定されるリニア新幹線の概要が発表されました。多くのメディアで取り上げられましたので興味を持って見られた方も多かったのではないでしょうか?
弊社の伊那支店がある長野県南部にもリニア新幹線の新駅ができる計画で、地元紙でも大々的に記事が掲載されました。これまで夢としてしか語られなかったことがにわかに現実味を帯びてきたことで、谷あいののどかな地方にこれからどのような風が吹きこむのか、住人としても目が離せない気がします。

閑話休題。

昨年の7月頃に『OCRのよもやま話』という記事を書きました。
今回はその続きということで、OCRにまつわる話題をいくつか追加したいと思います。

OCRと解像度

OCRとは、Optical Character Recognition(あるいはReader)の略で、紙に印刷された文字をイメージスキャナなどで読み取り、画像化された情報から文字情報を抽出する技術であることを以前の記事でご紹介しました。

OCRで文字を正確に取り出すために必要な要素を考えると、おおよそ以下の点が挙げられると思います。

  1. 元になる原稿の状態が良好であること(文字が鮮明で、紙に汚れや皺がないなど)
  2. 適切な解像度でスキャンされていること
  3. OCRソフトが適切な性能であること

このうち、2)の「解像度」について取り上げます。

OCRで使う解像度はスキャナなどで取り込む画像の品質を表すもので、dpi(ディーピーアイ)という単位を使います。これは、1インチ(2.54cm)の間隔にどれだけ物理的な点(画素)が配置されているかを示すもので、同じ大きさの画像で比べた場合は、解像度の値が大きいほど高精細な画像が得られます。

解像度は別の言い方をすると、1インチあたりの画素の密度を表すということができます。密度が濃ければそれだけ細かい描写が可能になります。以下はそれを模式図にしたものですが、文字のサンプルにあるように解像度が小さいと曲線などで滑らかな表現ができなくなります。

解像度

解像度

では、実際に異なる解像度でスキャナから取り込んで比較してみましょう。

以下は、スキャナの設定でそれぞれ 200dpi/400dpi に解像度を変更してJPEG形式に保存したデータの一部を示しています。

解像度の違い

解像度の違い

ちょっと分かりづらいかも知れませんが、ブラウザの表示倍率をあげて見ていただくと両者の違いが分かります。
以下は、この二つの画像を弊社のOCR変換製品『瞬簡PDF OCR』でテキストファイルに変換した結果です。

変換結果

変換結果

解像度が200dpiだと文字化けしてしまう箇所が、400dpiでは(完全ではないですが)おおむね正しく認識できていることが確認できます。

そうすると、もっと解像度を高くしてスキャンすれば更に良い結果が出せそうに思えます。ところが、これがさにあらず、なのです。
以下は、スキャナの設定を600dpiにして変換を行った結果です。

600dpiで変換

600dpiで変換

解像度を上げても、あまり変換結果に影響がないことが確認できるかと思います。
一般にOCR処理では、300~400dpiの範囲が適切なOCR結果を得る解像度だと言われています。それ以上解像度を上げてもファイルサイズが大きくなるばかりで、OCRの変換精度はあまり変わらないか、逆に悪くなってしまう場合もあります。ちなみに今回使用したJPEGデータの場合、400dpiのときのファイルサイズは約1.4MBですが、600dpiでは約2.7MBでした。

OCR処理を使って文字の取り出しを行う際には、スキャンの段階から適切な解像度を設定していただくことでより良い結果が得られます。ご参考にしていただければ幸いです。

※『瞬簡PDF 変換8』、『瞬簡PDF OCR』は製品の体験版を公開しております。是非、お試しください。


Windows 8.1 Preview の PDF 表示機能

PDF 表示機能の比較
https://blog.antenna.co.jp/ILSoft2/archives/779
の続きです。

Windows 8.1 Preview の Windows Reader でサンプル PDF (http://ondoc.logand.com/d/223/pdf)を開いてみました。

win8_1_test_pdf

右上のあたりで色が少し違うのと、縦書き文中の括弧の向きがおかしいのは Windows 8 の時と同じですが、
右下の「Text Image」と表示されるはずの部分が空白になっています。
Windows Reader は Windows 8 から 8.1 のバージョンアップで変化があることは確認できましたが、
このサンプルの表示に限っては、劣化していると言えるでしょう。


画像ファイルをスタンプ注釈に利用 PDF Tool 「V4」(もうまもなく)

私の住んでいる地域のコンビニ各社では淹れたてコーヒーの価格差がなくなり100円になりました。
次なる差別化はコーヒーにおつまみをつけるか否かということになってきています。

さて、「PDF Tool」は現在、V4リリースに向けて作業を行っています。
リリースのご案内は10月中旬頃にはできるかと思います。しばらくお待ちください。

V4の新たな機能として画像から直接PDFを作成したり、画像やPDFをスタンプ注釈にするというものがあります。
下記PDFは画像を直接PDF化し、画像をスタンプ注釈として貼り付けたものです。

スタンプ注釈(例)

スタンプとして用いた画像


スタンプしたpdf

スタンプしたpdf

●製品詳細ページ
『Antenna House PDF Driver API / Antenna House PDF Tool API 』

●無償の評価版をぜひお試しください! 
『Antenna House PDF Driver API / Antenna House PDF Tool API』評価版


Pages: Prev 1 2 3 ... 46 47 48 49 50 51 52 ... 118 119 120 Next