カテゴリー別アーカイブ: コラム

PDF Tool API V4販売開始

システム製品営業から報告です!

10月23日、PDF Tool API V4の販売を開始しました。
PDF Tool APIは、既存のPDFを加工・編集するツールになります。

  • PDFをページ単位に分割、または複数のPDFの結合
  • パスワードなどセキュリティの設置
  • 透かしの挿入
  • 文書情報(プロパティ)の取得
  • しおりの取得、作成、削除
  • 注釈情報の取得、作成、削除

などが可能です。

インターフェースは、C++、.NET、COM、コマンドラインを用意しております。

JAVAインターフェースにも対応予定

これまでのPDF Tool API V3.1は販売から4年が経っており、その間にWindows 64bitの利用が広がってきました。
PDF Tool API V4ではWindows 64bitのnaitiveに対応し、さらにLinux上でのご使用も可能となりました。

PDF Tool API V3.1の機能を引き継いでおりますが、より高速により使いやすい様に内部ライブラリを一新しております。
このため、V3.1とV4の互換はありませんのでご注意下さい。

PDF Tool API V4の詳細
https://www.antenna.co.jp/ptl/function02.html
PDF Tool API V3.1とPDF Tool API V4の相違点
https://www.antenna.co.jp/ptl/differ31.html

また、PDF Tool APIは、PDF Driver APIやServer Based Converterとあわせてご使用いただいているケースが多くなっております。
PDF Driver APIもしくはServer Based Coverterで作成したPDFの加工などに使われております。
PDF Driver APIとのセットも用意しておりますのでお問い合わせ下さい。

PDF Driver API V6
https://www.antenna.co.jp/ptl/function.html
Server Based Converter V5
https://www.antenna.co.jp/sbc/

評価版もご用意しておりますので、是非お試し下さい。
https://www.antenna.co.jp/ptl/trial.html




瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識


アウトライナー
PDFを解析して しおり・目次を自動生成

『PDFコンバーター』を上手に使う

 「AH PDF Server V3」の今回の改訂版では、コマンドラインプログラムから「PDFコンバーター」を使って変換する事が出来るように変更しました。今日はこの事に触れたいと思います。

 コマンドラインプログラムを利用しているお客様の多くは「Webアプリケーション」からご利用されているようです。提供する弊社としてもそのように利用される事は想定していますので、テストの段階からサンプル的なWebアプリケーションを作成して動作確認をしています。

 ただ、Webアプリケーションからコマンドラインプログラムを利用してオフィスファイルの変換を行う場合には少し注意が必要になります。

 MS-Office(Word/Excel/PowerPoint)はデスクトップ上で動作させる事を前提にしていますので、基本的にユーザーがログオンしていて「デスクトップ」が存在する事が必要となります(実際には設定次第でログオンしていなくても良いのですが、動作の保証が出来ないために弊社としてはお勧めしていません)。

 そしてコマンドラインプログラムが実行されるアカウント情報も基本的にログオンしているアカウントと同じ必要があります。この「アカウント情報」についてある程度理解していないとWebアプリケーションからコマンドラインプログラムを使ってオフィスファイルの変換を行うと上手く行きません。

 アカウント情報は基本的に起動した側の情報が引き継がれて行きます。例えば、コマンドプロンプトから起動した場合はコマンドプロンプトが持っている情報で実行されます。そのため、オフィスファイルの変換もほぼエラー無く(トラブル無く)実行出来ると思います。これはコマンドプロンプトがデスクトップ上で実行されており、ログオンしているユーザー情報が使われているためです。

 ところが、WindowsサービスやWebアプリケーション(IIS)から普通にコマンドラインプログラムを起動した場合、デフォルト状態ではローカルシステムなど、特殊なアカウント情報で実行する事になります。するとオフィスファイル変換ではエラーになってうまく変換する事が出来ません。コマンドラインプログラムでのお問い合わせはこの時点のものが一番多くなっています。

 WindowsサービスとWebアプリケーションでは同じ現象でも事情は少し異なるのですが、それでも「アカウント情報」や「アクセス権限」に関してはセキュリティの兼ね合いもあり、お客様の事情もスキルも異なる為に解決には時間がかかる場合もあります。

 そのため、今回の改訂版ではコマンドラインプログラムからも「PDFコンバーター」を使用出来るように変更しました。

 「PDFコンバーター」とは常駐アプリケーションプログラムで、フォルダ監視変換時のオフィス/アプリケーション変換を行うためのものです。フォルダ監視変換はWindowsサービスとして動作していますので、その補助的な役割を担っています。

 「PDFコンバーター」を使う利点はとにかくオフィスファイル変換やアプリケーション変換でアカウント情報などの煩わしい事を考えなくても変換が可能な事です。デメリットを挙げるなら必ずログオンしないと(デスクトップが存在する必要があるため)使えない事ぐらいでしょうか。それでもメリットの方が大きいと思います。

 プロフェッショナル版ではデフォルトの状態で「PDFコンバーター」を利用する設定になっています。設定自体はコントロールセンターから「PDF Server 設定(ユーザーズマニュアルでは117ページ以降)」に「Office/アプリケーション変換にPDFコンバータを使用する」という項目で設定出来ます。プロフェッショナル版ではフォルダ監視もあるため、PDFコンバーターを使う事がデフォルトになっています。

 一方、コマンド版ではデフォルトでは「PDFコンバーター」は使用しないようになっています。
そのため、利用するには設定の変更と「PDFコンバーター」の起動が必要になります。設定についてはデスクトップ上に作成される「AH PDF Server V3 コマンド」のショートカットをダブルクリックして「AH PDF Server V3 コマンドGUI」を起動します。左上の設定のカテゴリの中の「Office/アプリケーション変換にPDFコンバータを使用する」にチェックを入れて「登録」ボタンをクリックします。これで設定はOKなので、「閉じる」ボタンをクリックして「AH PDF Server V3 コマンドGUI」を終了します。

 「PDFコンバーター」はスタートメニューから「すべてのプログラム」→「Antenna House PDF Server V3」→「PDFコンバーター」をクリックする事で起動できます。Windowsの起動時に「PDFコンバーター」を起動するならショートカットを作成して「スタートアップ」フォルダにコピーするか、「タスクスケジューラー」に登録するなどします。

 これでコマンド版でも「PDFコンバーター」が利用出来ます。起動された「PDFコンバーター」はタスクトレイにアイコンで表示されています。

アイコン

 「PDFコンバーター」はオフィス/アプリケーション変換以外にもダイアログの自動応答も設定出来ます。目に見えて動作していないのであまり意識はないかも知れませんが、余計な事に労力を取られない分、コマンドラインプログラムでの利用は理にかなっていると思います。

——-

AH PDF Serverについて、詳細情報は製品ページをご確認ください。
また、評価版もWebページからダウンロード可能です。ぜひお試しください!
評価版お申込みページ

製品についてのお問い合わせ:
アンテナハウス株式会社システム営業までどうぞ。
TEL:03-5829-9021 e-mail:sis@antenna.co.jp




アウトライナー
PDFを解析して しおり・目次を自動生成


HTML on Word
WebページをWordで作る!

『AH PDF Server V3』の新しい改訂版が出ました。

 10月末に「AH PDF Server V3」の新しい改訂版がリリースされました。今週は少し改訂版にからめて新しい機能について書こうと思います。

 新しい改訂版についての内容はこちらになります。
https://www.antenna.co.jp/support/update-sys/psv/psv30.html

 今日は新しくプロフェッショナル版とコマンド版に追加された「AH PDF Server V3 コマンドGUI」について簡単に紹介します。

 「AH PDF Server V3 コマンドGUI」は PDF Server のコマンドラインプログラムの設定と実行テストが出来るようにしたWindowsアプリケーションです。コマンド版ではデスクトップ上に「AH PDF Server V3 コマンド」とショートカットが作成されます。プロフェッショナル版ではスタートメニューの「すべてのプログラム」→「Antenna House PDF Server V3」→「PDFServer V3 コマンド」で起動できます。

コマンドGUI画面

 「AH PDF Server V3」にはいくつか設定がありますが、そのうちシステム全体の設定を行う「PDF Server 設定」というのがあるのですが、これは「コントロールセンター」から設定が可能になっています。しかし、コマンド版には「コントロールセンター」は使用できないために実装されていません。そのため、サポートに寄せられたお問い合わせの中でコマンド版を使用していて「PDF Server 設定」の変更が必要なケースは設定方法をその都度ご案内してきました。

 しかし、いつまでもそのままにしておく訳にも行かなかったので今回、「PDF Server 設定」が簡単に行えるようにGUIプログラムを提供する事としました。GUI左上の「設定」というグループがそれに該当します。コマンド版では「PDF Server 設定」のうち、この3項目のみが利用されています。

 また、設定の下にはコマンドラインプログラムの実行を簡単に行う事が出来るようにしてあります。コマンドラインプログラムは実際の運用では他のプログラムから呼び出される事になると思いますが、最初はおそらくコマンドプロンプトかPowerShellを開いてコマンドを入力して動作を確認していると思います。「AH PDF Server V3 コマンドGUI」ではその最初の確認が容易に行えるようにチェックボックスやドロップダウンリストなどで設定して「実行」ボタンをクリックするだけでコマンドラインプログラムを起動して実行できます。もちろん、「実行パラメータ」に手動でパラメータを打ち込んでも実行出来て結果を別ウィンドウでステータスコードと共に確認する事が出来ます。

コマンド実行コンソール画面

 「実行パラメータ」の内容はコマンドラインプログラムの実行時にチェックしていないので、空のまま実行する事も出来ます(その時は結果の所にヘルプが表示されます)。GUI上では排他設定になるものは自動的に無効になったり、実行パラメータにすぐに反映されるため正しいパラメータが簡単に確認出来るので実際の運用時に間違う事が減ります。お問い合わせの中でもパラメータの間違いと言うものが思いの外多いのも事実ですので、こちらで確認してもらえればと思います。

 「AH PDF Server V3 コマンドGUI」は初期リリースの頃にはすでに開発されていました。元々は開発時にテストが簡単に行えるように考えられたものですが、最近はフォルダ監視よりもコマンドラインプログラムを利用のユーザー様が多く、問い合わせ内容等を考えると意外に有用性も高そうなので今回少しだけ体裁を整えてリリースしました。

 まずはお試し頂ければと思います。

AH PDF Serverについて、詳細情報は製品ページをご確認ください。
また、評価版もWebページからダウンロード可能です。ぜひお試しください!
評価版お申込みページ

製品についてのお問い合わせ:
アンテナハウス株式会社システム営業までどうぞ。
TEL:03-5829-9021 e-mail:sis@antenna.co.jp




瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品!


瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識

「瞬簡PDF タッチ」 最新アップデート情報

「瞬簡PDFタッチ -かんたん手書き入力-」は本日、最新版バージョン1.0.6を公開しました。

今回のバージョンアップは不具合の修正がメインとなりますが、すべて重要な内容となっておりますので必ずアップデートしていただくようお願いいたします。

追加/修正内容

  • 特殊なPDF注釈オブジェクトを表示できるようにしました。
  • 純粋なPDFを開いて保存をし続けるとファイルサイズが増え続けることがある問題を修正しました。
  • アンドゥで手書きオブジェクトをすべて削除した後、保存すると異常終了することがある問題を修正しました。

最新バージョン1.0.6は下記URLからダウンロードすることができます。
https://www.antenna.co.jp/support/update/pdftouch/pdftouch10.html

 




瞬簡PDF 変換 2024
PDFをOffice文書へ高精度変換


HTML on Word
WebページをWordで作る!

「瞬簡PDFタッチ」のWindows8.1対応について

「瞬簡PDFタッチ -かんたん手書き入力-」はタッチ操作と手書き入力に対応したPDF書き込みツールです。
タッチ操作で位置を決め、そのまま切り替えなしでシームレスにペン入力することができます。

先日発売されたWindows8.1での動作確認が遅れておりましたが、本日、動作確認済みとなりました。
Windows8以前のOSと同様に問題なくお使いいただくことができます。
「瞬簡PDFタッチ」のウリであるタッチ操作とペン入力が切替なしでできる機能も引き続きご利用いただけます。

動作確認は最新のバージョン1.0.6での確認となっております。
バージョンを確認するには「瞬簡PDFタッチ」を起動後、「アプリケーションボタン」を押してメニューから「バージョン情報」を選んでください。
バージョン番号が1.0.6より古い場合は改定情報ページよりアップデータファイルを取得して、アップデートをおこなってください。

なお、その他デスクトップ製品のWindows8.1対応状況については下記ページでご確認ください。
ほとんどの製品が動作確認済みとなっております。
PDFデスクトップ関連製品 Windows 8.1 での動作確認状況




アウトライナー
PDFを解析して しおり・目次を自動生成


瞬簡PDF 作成 2024
ドラッグ&ドロップでPDF作成

Windows8.1とPDFリーダーについて

つい先日Windows8.1がリリースされ、Windows8からの無料アップデートも開始されました。

弊社デスクトップ製品のWindows8.1対応状況については下記ページでご確認いただくことができます。
PDFデスクトップ関連製品 Windows 8.1 での動作確認状況

「瞬簡PDFタッチ」はまだ動作確認が完了しておりませんが、近日中に検証をおこない、結果を公開いたしますのでもうしばらくお待ちください。
なお、Windows8であった問題、「瞬簡PDFタッチで出力したPDFの手書き文字が、Windows8標準のPDFリーダーで表示されない」問題は、Windows8.1でもそのまま放置されているようです。
このバグが今回のリリースで修正されることを期待していましたが残念です。

今回はこのWindows標準のPDFリーダーについて少し触れたいと思います。
Windows8から搭載されたこの標準PDFリーダーはMetroスタイルのアプリケーションで、フルスクリーンでの表示とタッチ操作を前提に設計されています。

そのため通常のデスクトップアプリケーションとの親和性は高くなく、PDFを表示させながら他のアプリケーションを使うという操作がやりずらい面があります。
しかしそれ以前に、PDFの表示機能自体に多くの問題が見つかっています。
例えばリンクが機能しないことがある、一部PDFの描画がおかしい、添付ファイルが表示できない、一部注釈の表示がおかしい(そもそもリンク注釈は表示自体がされない)、レイヤーに未対応など、問題が多く、海外の掲示板などをみてもあまり評判はよくないようです。
標準のPDFリーダーとして使うにはまだ時期尚早といったところでしょうか。
これらの問題がOSのアップデートにより少しでも改善されていくと良いのですが、今回のWindows8.1のような大きなアップデートでも変わらないところを見ると、今後も望み薄なのかもしれません。

 




瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品!


HTML on Word
WebページをWordで作る!

TextPorterのWindows 8.1、Windows Server 2012 R2対応について

 TextPorterは、サーバ組込用のテキスト抽出エンジンで、Word, Excel, PDFなど色々なアプリケーションのファイルから文字列を抜き出します。

 TextPorterは、Windows 8.1、Windows Server 2012 R2に対応するかというお問い合わせを頂戴しています。
 TextPorterは、Windows 8.1、Windows Server 2012 R2に対応いたします。
 時期につきましては、Windows 8.1、Windows Server 2012 R2の正式版出荷後、1ヵ月ほどを予定しております。
 Windows 8.1、Windows Server 2012 R2の正式版出荷時の最新版(現在の最新版は、V5.3 MR2ですが)で、テスト、動作確認を行ないます。
 もし、問題が起きたときは、改良を加えて、MRとしてリリースする予定です(V5.3 MR2で問題が発生したときは、V5.3 MR3としてリリーする予定です)。
 動作保証ができる段階になれば、その旨、ウェブなどでお知らせいたします。
 いずれにしましても、最新バージョンの最新MRで、Windows 8.1、Windows Server 2012 R2に対応することになります。

 なお、最新版以前のバージョンにつきましては、まことに勝手ながら動作保証の対象外とさせていただきたく存じます。
 どうしてもいう場合は、弊社にお問い合わせ下されば、善後策を協議することができると考えております。
 よろしくお願いいたします。

 TextPorterについての詳しい説明は、
 TextPorter をご覧ください。
 
 評価版もご用意しております。
 TextPorter 評価版のお申し込み から、お申し込みください。

 アンテナハウスのシステム製品につきましては、事前に技術相談会を行っております。お気軽にお問い合わせください。
 詳しくは、
 アンテナハウス システム製品技術相談会
をご覧の上、お申し込みください。




HTML on Word
WebページをWordで作る!


瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品!

Server Based Converter V5.0 改訂第2版(MR2)をリリース

 Server Based Converterをお使いのお客様で、弊社と保守契約を結んでいらっしゃるお客様には、バグ修正を行ったメンテナンスリリース(MR)を配布しております。
 現在、Server Based ConverterのV5.0 改訂2版(MR2)のリリースを予定しております。
 原稿執筆時点では、まだダウンロードが可能になっておりませんが、2013年10月8日から、ダウンロード可能になる予定です。
 保守契約を結んでいらっしゃるお客様で、該当するバージョンをお持ちの方は、ダウンロードして、お試しください。

 なお、他のバージョンにつきましては、今回、メンテナンスリリースはございません。
 以前、お知らせしました通り、
・最新版につきましては、従来通り、おおよそ3ヵ月に1回、年4回を目安とした配布。
・最新版以外のバージョンにつきましては、おおよそ半年に1回、年2回を目安とした配布
と、変更させていただいております。
 何卒、ご了承くださいますよう、お願い申し上げます。

・V5.0 改訂第2版(MR2)
改訂内容は、https://www.antenna.co.jp/support/update-sys/sbc/sbc50.html#v50mr1を、ご覧ください。
ダウンロードは、https://www.antenna.co.jp/sbc/user_V50mrdl_in.htmlから、行なってください。

 以前のバージョンの改訂情報は以下の通りです。

・V4.0 改訂第4版(MR4)
 改訂内容は、https://www.antenna.co.jp/support/update-sys/sbc/sbc40.html#v40mr4を、ご覧ください。
 ダウンロードは、https://www.antenna.co.jp/sbc/user_V40mrdl_in.htmlから、行なってください。
・V3.1 改訂第5版(MR5)
 改訂内容は、https://www.antenna.co.jp/support/update-sys/sbc/sbc31.html#v31mr5を、ご覧ください。
 ダウンロードは、https://www.antenna.co.jp/sbc/user_V31mrdl_in.htmlから、行なってください。
・V3.0 改訂第10版(MR10)
 改訂内容は、https://www.antenna.co.jp/support/update-sys/sbc/sbc30.html#v30mr10を、ご覧ください。
 ダウンロードは、https://www.antenna.co.jp/sbc/user_V30mrdl_in.htmlから、行なってください。

 Server Based Converterは、Microsoft Office, PDFなどのファイルを、PDF, Flash, SVG, 各種画像形式にダイレクトに変換する変換エンジンです。
 ダイレクト変換の意味は、たとえば、Microsoft Officeがない環境でも、ファイルさえあれば、それをダイレクトに内容を見える形式に変換できるのです。ダイレクト変換には、Microsoft Officeのライセンスも不要です。
 Server Based Converterは、ダイレクト変換というユニークさが評価され、多くのウェブサービス、パブリッククラウド、プライベートクラウドなどで利用されています。

 Server Based Converterに関する詳しい情報は、
https://www.antenna.co.jp/sbc/
を、ぜひ、ご覧ください。
 評価版もご用意しております。
 サーバベース・コンバーター 評価版のお申し込みから、お申し込みください。

 アンテナハウスのシステム製品につきましては、事前に技術相談会を行っております。お気軽にお問い合わせください。
 詳しくは、
アンテナハウス システム製品技術相談会
をご覧の上、お申し込みください。




瞬簡PDF 編集 2024
かんたん操作でPDFを自由自在に編集


瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品!

続・OCRのよもやま話(2)

以前の記事『OCR技術の活用』で、OCR技術は文字の誤認識が避けて通れないということを説明しました。
また、その際に「これまで人の手で時間をかけて行っていたことも、コンピューターにまかせられるところは上手に利用して、人間でなければできない別のところに時間とエネルギーを使うのがOCR技術の賢い使用方法だと思います。」という感想を書きました。
OCRは弱点があるにしても、ソフトウェア技術として利点を活かしながらうまく利用することで強力なツールになる、という思いがあったからでした。

人力OCR!?

ところが世の中の動きは必ずしもそうではないようで、なんとOCRを「人力」で行うサービスというのがあるようです。

OCRを使った商品の代表的なものというと名刺管理ソフトが思い浮かびますが、これはスマートフォンやスキャナで取った名刺やその他の画像を専用サービスのサイトに送るとオペレータがその画像から文字を読んでテキストデータとして入力し結果を返してくれるというもので、もちろん認識率は並み居るOCRソフトを凌駕したものになります。

「OCRを人力で!?」と聞くと、OCRがソフトウェアの技術だと思い込んでいる私には寝耳に水なのですが、これを手書きの書類をコンピューターに入力するような代行サービスの一種だと考えると、以前からある話しで何のことはないですね。
ただ、これらのサービスが現代風に感じるのは、名刺などをスマートフォンに搭載されたカメラで撮影して専用アプリでクラウドに送信し結果をEvernoteなど別のクラウドサービスで受け取るようになっていること、入力代行しているオペレータが時には中国など遙か海の向こうで作業をしているといったグローバルな仕組みで提供されるというところです。

こういったサービス自体は数年前からWeb上などでも紹介されているので今頃驚いているのが恥ずかしいのですが、考えてみるとこれはOCRの「文字認識率が完全にはならない」というネガティブな点を補う意味で理にかなった利用法であると思えます。

おそらくこの仕組みでは、ユーザーから送信されたデータを一から打ち直すことなどしないで、ある程度はOCRソフトで変換を行った上で誤認識している部分を目視で確認して修正するみたいなことをしているのだと思います。そうすると、「人間でなければできないところ」を補って結果として100%の認識率を実現しているのですから理想的な利用法といえます。

名刺に限らず手書き文字でもOKなようですから、そういったデータをデジタルで管理したい方には利用価値があるかも知れません。
弱点は、人手を介することで利用状況によっては結果が返るのに時間がかかる場合があることだそうです。
お隣りの中国では経済発展の結果として人件費が高騰しつつあるということですから、今後のサービスの行方も気になります。

※『瞬簡PDF 変換8』、『瞬簡PDF OCR』は製品の体験版を公開しております。是非、お試しください。




瞬簡PDF 作成 2024
ドラッグ&ドロップでPDF作成


瞬簡PDF 編集 2024
かんたん操作でPDFを自由自在に編集

続・OCRのよもやま話

先日、JR東海から2027年度に開業が予定されるリニア新幹線の概要が発表されました。多くのメディアで取り上げられましたので興味を持って見られた方も多かったのではないでしょうか?
弊社の伊那支店がある長野県南部にもリニア新幹線の新駅ができる計画で、地元紙でも大々的に記事が掲載されました。これまで夢としてしか語られなかったことがにわかに現実味を帯びてきたことで、谷あいののどかな地方にこれからどのような風が吹きこむのか、住人としても目が離せない気がします。

閑話休題。

昨年の7月頃に『OCRのよもやま話』という記事を書きました。
今回はその続きということで、OCRにまつわる話題をいくつか追加したいと思います。

OCRと解像度

OCRとは、Optical Character Recognition(あるいはReader)の略で、紙に印刷された文字をイメージスキャナなどで読み取り、画像化された情報から文字情報を抽出する技術であることを以前の記事でご紹介しました。

OCRで文字を正確に取り出すために必要な要素を考えると、おおよそ以下の点が挙げられると思います。

  1. 元になる原稿の状態が良好であること(文字が鮮明で、紙に汚れや皺がないなど)
  2. 適切な解像度でスキャンされていること
  3. OCRソフトが適切な性能であること

このうち、2)の「解像度」について取り上げます。

OCRで使う解像度はスキャナなどで取り込む画像の品質を表すもので、dpi(ディーピーアイ)という単位を使います。これは、1インチ(2.54cm)の間隔にどれだけ物理的な点(画素)が配置されているかを示すもので、同じ大きさの画像で比べた場合は、解像度の値が大きいほど高精細な画像が得られます。

解像度は別の言い方をすると、1インチあたりの画素の密度を表すということができます。密度が濃ければそれだけ細かい描写が可能になります。以下はそれを模式図にしたものですが、文字のサンプルにあるように解像度が小さいと曲線などで滑らかな表現ができなくなります。

解像度

解像度

では、実際に異なる解像度でスキャナから取り込んで比較してみましょう。

以下は、スキャナの設定でそれぞれ 200dpi/400dpi に解像度を変更してJPEG形式に保存したデータの一部を示しています。

解像度の違い

解像度の違い

ちょっと分かりづらいかも知れませんが、ブラウザの表示倍率をあげて見ていただくと両者の違いが分かります。
以下は、この二つの画像を弊社のOCR変換製品『瞬簡PDF OCR』でテキストファイルに変換した結果です。

変換結果

変換結果

解像度が200dpiだと文字化けしてしまう箇所が、400dpiでは(完全ではないですが)おおむね正しく認識できていることが確認できます。

そうすると、もっと解像度を高くしてスキャンすれば更に良い結果が出せそうに思えます。ところが、これがさにあらず、なのです。
以下は、スキャナの設定を600dpiにして変換を行った結果です。

600dpiで変換

600dpiで変換

解像度を上げても、あまり変換結果に影響がないことが確認できるかと思います。
一般にOCR処理では、300~400dpiの範囲が適切なOCR結果を得る解像度だと言われています。それ以上解像度を上げてもファイルサイズが大きくなるばかりで、OCRの変換精度はあまり変わらないか、逆に悪くなってしまう場合もあります。ちなみに今回使用したJPEGデータの場合、400dpiのときのファイルサイズは約1.4MBですが、600dpiでは約2.7MBでした。

OCR処理を使って文字の取り出しを行う際には、スキャンの段階から適切な解像度を設定していただくことでより良い結果が得られます。ご参考にしていただければ幸いです。

※『瞬簡PDF 変換8』、『瞬簡PDF OCR』は製品の体験版を公開しております。是非、お試しください。




瞬簡PDF 作成 2024
ドラッグ&ドロップでPDF作成


瞬簡PDF 編集 2024
かんたん操作でPDFを自由自在に編集
Pages: Prev 1 2 3 ... 40 41 42 43 44 45 46 ... 110 111 112 Next