カテゴリー別アーカイブ: PDF の仕様

ISO 32000-2 PDF 2.0で新しく追加になった主要機能のリスト

PDF 2.0の仕様策定がだいぶ進んでいます。現在のステータスは、40.99(Full report circulated: DIS approved for registration as FDIS)とありますのでもうすぐ最終承認プロセスになりそうです。Adobeの担当者のコメントでは、夏前に出版される可能性はない[1]とありますが。いずれにせよそう遠い時期ではないでしょう。

ドラフトの仕様書はISOのストアで販売されています[2]

このドラフト仕様書によりPDF 2.0の主な変更点をチェックしてみました。次に項目だけ挙げます。技術書典2[3]にむけて『PDFインフラストラクチャ解説』[4]の第二版を準備中ですので、もう少し調べて第二版に反映します。

本文でPDF 2.0で廃止という意味は、PDF のバージョン番号に2.0を指定したときは使ってはいけないという意味です。PDF 1.7以前のバージョン番号を指定したときPDFで使うのは問題ありません。

1.文書のメタデータ(7.5.5 File trailer、14.3.3 Document information dictionary)
メタデータは文書情報ではなくXMPによるメタデータストリームを使うことになります。文書情報の中でPDF 2.0で許されるのは作成日と更新日のみです。それ以外の項目は廃止となります。

2.暗号化(7.6 Encryption、7.6.3 General encryption algorithm)
PDF 2.0では暗号化のアルゴリズムはAES-256対称キーアルゴリズムの32バイトファイル暗号化キーを使うようになります。RC4とかAESアルゴリズムは廃止です。

3.標準セキュリティハンドラー(7.6.4.2 Standard encryption dictionary)
新しいバージョン番号を指定します。古いセキュリティハンドラは廃止です。

4.(新機能)非暗号化ラッパ文書(7.6.6 Unencrypted wrapper document)
独自のセキュリティハンドラで暗号化してしまうとその内容にアクセスできなくなります。これを避けるため暗号化しないラッパを残すことができます。

5.テキスト文字列(7.9.2.2 Text string type)
UnicodeのUTF-8の符号化をつかえるようになります。

6.黒点補償(8.6.5.9 Use of black point compensation)
デバイス独立グラフィック状態に黒点補償パラメータが追加になります。

7.文書レベルのナビゲーション(12.3 Document-level navigation)
コレクション(PDF 1.7のアドビ独自拡張)の機能が大幅強化となります。(12.3.5 Collections)
・コレクションに階層化フォルダーが設定できます。(12.3.5.2 Collection hierarchical folders)
・navigatorにレディメイドのコレクションのレイアウトを指定できます。(12.3.6 Navigators)

8. 注釈タイプ(12.5.6.1 General)
プロジェクション注釈が新しく用意されます。(12.5.6.24 Projection annotations)
リッチメディア注釈が新しく用意されます。(12.5.6.25 3D and RichMedia annotations)
音声(Sound)注釈、動画(Movie)注釈、TrapNet注釈の3種類は廃止となります。

9.フォーム(12.7 Forms、12.7.3 Interactive form dictionary)
XFAフォームは廃止となります。
フォームの外観は常に必要となります。

10.電子署名(12.8 Digital signatures)
大幅に変更になります。
PAdESが追加されます。(12.8.3.4 CAdES signatures as used in PDF)
署名の長期検証機能が追加になります。(12.8.4 Long term validation of signatures)
文書タイムスタンプが追加になります。(12.8.5 Documenttimestamp (DTS) dictionary)

11. 地理空間座標システム(12.10 Geospatial features)
新機能です。
地球上の地図と連動する位置指定ができるようです。

12. 3次元アートワーク(13.6 3D Artwork)
大幅強化されます。
3次元の注釈機能が強化されます。(13.6.2 3D Annotations)
3次元の距離(直線距離、垂直距離、角距離)が定義できるようになります。(13.6.7 Persistence of 3D measurements and markups)

13. リッチメディア(13.7 Rich media)
リッチメディアが強化されます。
音声・動画が廃止となりリッチメディアに統合されます。

14. 論理構造(14.7 Logical structure)
タグ付きPDFのタグに、名前空間を使えるようになります。(14.7.4 Namespaces for tagged PDF)
タグ付きPDFのタグの構造が大幅に変更になります。

15. アクセシビリティ
発音のヒント機能が追加になります。(14.9.6 Pronunciation hints)

16. 文書部品(14.12 Document parts)
新機能です。PDFのページへのランダムアクセス機能が強化されます。

17. 関連ファイル(14.13 Associated files)
新機能です。

[1] https://forums.adobe.com/message/9134153#9134153
[2] ISO/DIS 32000-2.4 Document management — Portable document format — Part 2: PDF 2.0
[3] 技術書典2
[4] 『PDFインフラストラクチャ解説』

2017/3/3追記

『PDFインフラストラクチャ解説』V1.1の原稿を下記に公開しました。

付録:もうすぐ出版されるPDF 2.0の概要

『PDFインフラストラクチャ解説』を1.1版に改訂し、上のWebページをそのままV1.1版の付録として収録します。付録にしたのは仕様書がまだドラフトのためです。すでに本をお求めの方は、Webをご覧いただければ改めてご購入の必要はありません。

新しくお求めのかたはしばらくお待ちください。今週月曜日にPODに出しましたので、来週には発売されると思います。


『瞬簡PDF 書けまっせ 7』最新版を紹介するセミナー

PDFに文字や図形を簡単に追加できる『瞬簡PDF 書けまっせ7』最新版に触れるチャンス

10月24日月曜日に東京曙橋の市ヶ谷健保会館「CAS-UB サービス開始五周年記念セミナー」アンテナハウス主催で開催いたします。

このセミナーは2部構成になっており、前半の第1部で、弊社一番人気の新バージョン『瞬簡PDF 書けまっせ7』をご紹介します。

PDFに文字や図形を追加できると、PDFの利便性が飛躍的に高まります。『瞬簡PDF 書けまっせ7』は、簡単な操作でPDFに文字や図形を追加することができます。今回は初めて『瞬簡PDF 書けまっせ7』をご覧になる方を対象に、簡単なデモを交えながら、『瞬簡PDF 書けまっせ7』のポイントをご覧いただきます。

アンテナハウスが取り組むPDFの課題

2016年4月より障害者差別解消法が施行され、PDFで提供する情報内容をアクセシブルとすることが求められています。『瞬簡PDF 書けまっせ7』ご紹介の後、短い時間ではありますが、PDFのアクセシビリティとはどのようなことか、どういった方法でアクセシブルPDFにできるかを整理しつつ、アンテナハウスでの取り組みを簡単に説明します。

10月24日(月)のセミナーへのお申し込みはこちらからどうぞ:
http://www.cas-ub.com/user/seminar.html

 


『PDFインフラストラクチャ解説』出版報告&特別講演会開催のお知らせ

アンテナハウスブログ「I love software」で、2005年10月~2008年7月の1000日間に亘って連載された「PDF 千夜一夜」に、2015年までに集めたPDF関連の情報やオリジナルの内容を加筆修正し、網羅的にまとめあげたものが、『PDFインフラストラクチャ解説:電子の紙PDFとその周辺技術を語り尽す』として出版します。

現段階では、Kindle ダイレクト・パブリッシング(KDP)で出版開始され、もう間もなくペーパーバックでも出版される予定です。

さて、そんなPDFに関する知識が満載された『PDFインフラストラクチャ解説』の出版を記念し、2月16日(火)、講演会を開催します。
PDFにおけるあれやこれを、いろいろ訊けるチャンスです!

『PDFインフラストラクチャ解説』出版記念特別講演会

  • 開催日時: 2016年2月16日(水)16時00分~18時10分
  • 開催場所: 市ヶ谷健保会館 E会議室
  • 参加費講演会のみ: 1,000円(税込)
  • 定員: 30名(事前予約制)
  • 詳細・お申込みURL:http://peatix.com/event/138690

ゲスト
松木眞氏(画像電子学会フェロー):PDFの国際規格ISO32000やPDF/Xなどの派生規格の作成等に参加。
ISO32000:PDFの国際規格の現状と将来について(仮)、いろいろ語っていただきます。

●『PDFインフラストラクチャ解説:電子の紙PDFとその周辺技術を語り尽す』

PDFインフラストラクチャ解説(表紙)

目次・書籍詳細
http://www.antenna.co.jp/pdf/reference/pdf-infra.html
(青い「目次紹介」をクリックすると、目次が表示されます)

本書のご購入は、こちらからどうぞ!
Amazon Kindleストア

エンドユーザーではなく、「技術者向け」の内容です。
(もちろん、技術者でない方でもPDFの成り立ちや、なぜそこにPDFが使われるのかなど、仕事仲間と話題にできる蘊蓄を仕入れられます)
PDFの仕様、製品に実装するための必要な技術情報など、PDFを中心に組版に必須のフォントや文字などの関連項目について解説。PDF登場の経過や歴史的側面の解説も多いので、読みごたえはあるかと思います。
昨今話題の電子署名やタイムスタンプ、長期保存、PDFから別のファイル形式(Officeやimgなど)への逆変換などにも解説しています。

●PR●
PDFに関する疑問にお答えします。「PDF資料室」:http://www.antenna.co.jp/pdf/reference/


PDFとEPUBのフォント埋め込みについての簡単な解説文

CAS-UBのブログで、PDFとEPUBのフォント埋め込みについての簡単な用語解説文を書いています。

フォント埋め込みとは

電子ドキュメント内の文字情報は文字コードを使って表されるが、文字コードだけでは文字の形は分からない。文字コードをもとに文字の形を描画するにはフォントを使う。電子ドキュメント作成時にフォントのデータを内部に含めることを「フォント埋め込み」という。フォントを埋め込んだ電子ドキュメントを配布すれば、受け手は埋め込まれたフォントを使って文字を可視化できるので、例えば太字、丸文字など、ドキュメント作成者の意図した形で文字を表現できる。

さらに詳しく


[MS14-045] 更新プログラム 2982791 の問題を解決する更新プログラム 2993651 を公開

こんにちは、弊社デスクトップ製品のサポート担当です。

前回は、8月13日以降に配信されたWindows Update の更新プログラムでブルーバックが起きる問題について取り上げました。

この更新プログラムは8月13日から15日にかけて配信がされ、8月18日以降は配信が停止されたため、この期間内にWindows Updateを行ったパソコンにのみインストールがされて問題を起こすというものでした。
このため、いったんこの更新プログラムをパソコンからアンインストールすれば、その後は問題が起きないようになっていました。

ところが、9月になってお客様から、いったんブルーバックが出ないようになったはずなのにまた同じ問題が再発するようになったとのお問い合わせをいただくようになりました。
調べてみると、Microsoft社から8月27日以降に新たな更新プログラムが配信されていました。

それによりますと、この更新プログラムは8月13日に公開して問題となったKB2982791の不具合を修正するものであるとの説明がされ、インストールを行うように推奨されています。
しかしながら、弊社で確認をしたところ、この更新プログラムがインストールされていることでブルーバックの問題が再発しており、これをアンインストールすることで問題が回避できる場合があることが分かりました。

問題の解決のためには、この更新プログラムのアンインストールをお勧めしたいところですが、現在、Microsoft社から”KB2993651″は重要なセキュリティの更新プログラムであるという案内がされています。
このため、もしお客様でこの更新プログラムを削除されたくない場合は、当面の回避策として内容をPDFに保存し、PDFを表示したアプリケーションから印刷を行っていただくことをお願いしております。
ただ、これはあくまで印刷を行う場合のみの回避策であり、他のケースには使えません。
そのような場合には、いったんこの更新プログラムを削除して様子をみていただくようご案内しております。

この更新プログラムの別の情報「[MS14-045] カーネル モード ドライバーのセキュリティ更新プログラムについて (2014 年 8 月 27 日)」によれば、この更新プログラムには既知の問題が残っており、「マイクロソフトでは現在この問題の解決に取り組んでいます。」との説明があります。明確ではありませんが、今後別の更新プログラムが用意されて改善される可能性も考えられます。
弊社でも、新しい情報があれば適宜ご案内していきたいと思いますので、よろしくお願いいたします。

この問題の詳細につきましては弊社ホームページおよび製品サイトでもご案内しておりますので、ご参照ください。


2014 年 8 月 13 日公開の更新プログラムの適用により問題が発生する場合がある

こんにちは、弊社デスクトップ製品のサポート担当です。平素は弊社製品をご愛用いただき、ありがとうございます。

さて、お盆休みがあけた8月17日の週から弊社サポートにはたくさんのお問い合わせが寄せられております。

お問い合わせの内容は、弊社製品『瞬簡PDF 書けまっせ6』、『書けまっせ!PDF5』、『瞬簡PDF 編集5』に関するもので、それぞれ操作画面から印刷を行うとWindowsがシャットダウンして青い画面に白字でエラーが表示され再起動されてしまうというものです。
Windowsでシャットダウン時に青い画面が表示されるのは、ブルーバックまたはブルースクリーンと呼ばれるもので、OSの中核部分に問題が生じた場合に発生するかなり深刻な状態です。

それまで弊社製品から普通に印刷ができていたものが、ある日を境に急にこのような現象が起きてしまったということで驚かれたお客様が多かったかと思います。また、時間をかけて編集した内容が一瞬にしてなくなってしまわれた方もおられました。

問題の起きた状況から、Windowsの更新プログラムが関連している可能性が推測されましたが、
これについて、Microsoft社から、8月13日に配信されたWindows Update の更新プログラムに問題があったことが同社のブログ記事で公開されました。

それによりますと、全部で4つの更新プログラムのいずれかが関与していること、これらをパソコンからアンインストールすることで問題が回避できること、これらの更新プログラムの配信は8月18日より停止したことが説明されています。

弊社で確認をしたところ、以下の二つの更新プログラムをアンインストールすることで問題が回避できることが分かりましたので、お客様にもそのようにご案内を行っております。

  • KB2982791
  • KB2970228

この問題の詳細につきましては弊社ホームページおよび製品サイトでもご案内しておりますので、ご参照ください。

※なお、『瞬簡PDF 書けまっせ6』では、PDFを表示した画面に別のPDFファイルを画像として挿入する操作でもブルーバックが発生することが確認されております。この場合も上記と同様の対処方法で回避できることを確認しております。
※この問題につきましては続報を次回掲載いたします。


PDFの色指定について(2)

前回、PDFのデバイスカラースペースの3種類について説明しました。これらはその名前にある通りデバイスに依存したカラーの表現方法でした。そのため同じRGB値、あるいはCMYK値でも、デバイスが異なると違って見えることになります。同じ写真を2つの違うプリンタで印刷したり、同じ番組を違うテレビで見たり、といった身近なところでも経験することが多いかと思います。PDFの場合にあてはめれば、何か文書を作成してPDF化し、他の人にそのPDFを送って参照してもらうような場合に、作成した人が見ている画面と、送った先の人が見ている画面(あるいは印刷した紙)では別の色が表示されている、という現象になります。

このあたりを解決する、つまり異なるデバイス間で、同じカラー指定に対して同じ出力を行うことを目的としたカラースペースがCIEベースのカラースペースとなります。同じ出力といっても、当然ながら「そのデバイスの制限範囲内で」という制限がつきます。ディスプレイにしてもプリンタにしても、デバイスによって可能な色の再現範囲は異なりますので、その中で、指定に近い出力を得る(カラー値やカラースペースをどう調整しても、モノクロプリンタでカラー写真を印刷はできませんし)ことが目標となります。

前回記載したPDFで定義されている CIEベースカラースペース として、CalGray、CalRGB、Labは、および ICCBased の4種類を記載しました。これらのカラースペースの内容、指定されたカラー値を再現する方法の説明となるわけですが、PDFの仕様以前に、色とは何か、という非常にやっかいな説明が必要となってしまいます。わかる範囲で少し説明を試みてみたいと思います(デバイスカラースペースは、光の3原色、あるいは、プリンタのインクというような身近なところから、なんとなく理解できそうなので、色とは、などという説明抜きでなんとなく説明できましたが)。

おおざっぱにいえば、なんらかの光源から発した光が、物体にあたって反射し、人間の目に入り、人間がその物体の色として認識する、ということになります。赤いクルマといっても、太陽光の下で見る場合と、トンネル中の証明で見る場合と違うのは光源の発する光の性質が異なっていることによります。この光ですが、波としての性質を持つ、空中を伝わる振動エネルギーの束と考えることができるようです。波の性質として波長がありますが、高エネルギーの光の波長は短く(たとえば、X線では 1nm)、低エネルギーの光の波長は長く(ラジオの中波は100m~1km)なります。人間の目がとらえることができる可視光の波長は380nm~700nmのきわめて狭い領域ですが、この短波長側の光を紫、長波長側の光を赤として認識します。その外側を、がそれぞれ紫外線、赤外線と呼んだりします。また、虹などでは紫から赤までを適当に区切って7色と数えたりします。太陽光のような実際の光はいろいろな波長が混在した光です。可視光内で、緑の波長(国際照明委員会の規定では546.1nmだそうです)が多く含まれていれば緑、各波長の光が均等に含まれていると白と認識します。

ちょっと先走って、人間が赤とか紫とか認識すると書きましたが、人の目に入ってきた光は角膜、水晶体を通過して網膜にあたります。網膜上には光に反応する受容体として桿体、錐体というものが存在します。この錐体に可視光内の長波長(赤)に反応するもの、中波長(緑)に反応するもの、短波長(青)に反応するものがあり、それぞれの錐体がどのくらい反応するかで光の色を認識することになります。

色の話になってしまって、PDFのCIEベースカラースペースの話まで進めませんでした。こういう色というものをコンピュータ上でどう表現するか、さらにPDFではどう表現するか、また続きを記載したいと思います。


PDFの色指定について

これまで、PDFの関連仕様としてPDF/X,PDF/A などについて説明してきました。これらの各仕様の中には「カラーの再現性を保証」するために、PDFがサポートする各種カラースペースに対して制限を設けているものがありました。たとえば、PDF/X-1およびPDF/X-1aでは、使用できるカラースペースをCMYK(およびグレースケール)に限定しています。今回からPDFで使用できる色について、説明してみたいと思います。

PDFのカラー機能
まずPDFのカラー機能ですが、色を指定する機能と色を描画する機能に分けられます。
色を指定する機能
ページコンテンツの文字、線、画像、あるいは、ページコンテンツ以外のしおり、注釈といった各種オブジェクトに対して色を指定する機能になります。
色を描画する機能
色の変換やガンマ補正などを行ってPDF内に指定されている色を表示する機能です。

PDFの作成者側では、PDF内の各種オブジェクトに対して色を指定し、PDFの表示・印刷などの使用者側では、指定された色を解釈し、対象のデバイスで使用可能な機能を用いて指定された色を再現することになります。PDFの色指定には様々な方法が用意されています。表示する特定のデバイスに依存しない方法で色を指定することもできます。

PDFのカラー指定
次にPDFでカラーを指定する方法を見ていきたいと思います。
カラー値
PDF内での色の指定方法は各種存在しますが、通常、カラースペースを指定し、カラースペースによって決まるカラー成分毎に値を指定することになります。たとえば、RGBカラースペースであればカラー成分はR,G,Bの3成分を持ちますので、カラースペースとしてRGBを指定したのち、これらの各成分に対応する3種類の値を指定することになります。
カラースペース
PDFで使用されるカラースペースの説明に入ります。PDFのカラースペースは大きく3種類のカテゴリに分類されます。

  • デバイスカラースペース
    • DeviceGray
    • DeviceRGB
    • DeviceCMYK
  • CIEベースカラースペース
    • CalGray
    • CalRGB
    • Lab
    • ICCBased
  • 特殊カラースペース
    • Pattern
    • Indexed
    • Separation
    • DeviceN
デバイスカラースペース
出力デバイス上の表現に直接関係するカラー値を指定します。一番簡単な指定方法ですが、同じ指定をしても出力デバイスが異なれば違った色に見えることが多いという欠点もあります。

  • DeviceGray
    無彩色の光の輝度を白と黒の比率で制御します。カラー値の成分は1つであり、黒 0 ~白 1の範囲で表現されます。
  • DeviceRGB
    加法混色の3原色 赤・緑・青(R,G,B)を成分に持ち、各成分の値を 0(成分無)~1(最大輝度)で表現します。黒(0,0,0) ~白(1,1,1)となります。
  • DeviceCMYK
    減法混色の4原色 シアン、マゼンタ、イエロー、ブラック (C/M/Y/K)を成分に持ち、各成分の値を0(その成分無)から1(最大濃度)で表現します。白(0,0,0,0)から黒(1,1,1,0) となります。成分Kは、理論的には不要ですが、CMYのインクを混合して黒を生成するより黒インクを使用するほうが印刷上、きれいな黒が表現されるために使用されます。(0,0,0,1)も黒となります。

PDF内で、各カラースペースを混在して指定することができます。たとえば黒でABCと3文字表示されていても「A」はDeviceGrayの0、「B」はDeviceRGBの(0,0,0)、「C」はDeviceCMYKの(1,1,1,0)という場合もあり得ます。(PDF/XやPDF/Aではこのあたりの混在使用を禁止しています)

次回、CIEベースカラースペースについて説明したいと思います。


PDF/A-1aのタグの見方

今回は PDF/Aの作成方法(準拠レベルA) でAcrobat/Wordが出力したPDF/A-1aの内容、主にタグ部分について少し見てみたいと思います。
レベルAではレベルBが持たない情報である文書の論理構造、言語などの情報を持つ必要がありました。PDFでは、文書の論理構造を表現するためにタグと呼ばれる仕組みを用意しています。
このあたりをつかって元文書がどのように表現されているか、Wordで簡単なサンプル文書を作成して、PDF/A-1aに変換したものを見てみます。

Word文書

Word文書

章、節、項の部分はWordの組み込みスタイルである「見出し1」~「見出し3」を使用し、
リスト番号を付加したものです。他に、箇条書き、表、画像 などを入れてみました。

Acrobat XIでは 「表示メニュー」の「表示切り替え」-「ナビゲーションパネル」-「タグ」とすることで、ドキュメント内につけられているタグの様子を見ることができます。左側にタグが階層表示され、ここをクリックすると本文内の対応する箇所がハイライト表示されます。
Word 2013で「PDF/A」および「アクセシビリティ用のドキュメント構造タグ」を指定して作成したPDFの場合
PDFの場合
このように表示されます。

一方、Word 2013から Acrobat XIのWord用PDFMakerでPDF/A-1aを指定して作成したPDFの場合
2013-12-06-03
となりました。

主なところだけ展開したキャプチャです。似たような構造ですが、タグの名前をはじめとして、細部では若干タグのつけ方も異なっていることがわかります。

PDFMakerでは「見出し1」など、Wordのスタイル名をそのままタグ名に使用しています。これら独自のタグ名をPDF仕様が用意している標準的なタグ名に割り当てる「ロールマップ」という仕組みがPDFに用意されていて、Acrobatでも表示させることができます。
ロールマップ

これを参照すると、スタイル名の「見出し1」を標準タグの「H1」に対応づけていることがわかります。

このような形でタグを使用して元文書の論理構造をPDFで表現します。

また、比較のために、Wordの「見出し1」などのスタイルを使わずに、表示だけ似たような形の文書を作成してPDF/A-1a出力してみます。
スタイルを使わない場合
ここの 章番号 1. 、1.1.1 などはWordのリスト番号ではなく、通常のテキスト入力したものです。
PDF/A-1aに変換した結果のタグを見てみます。
結果
これはWordのPDF保存の場合ですが、このように、こちらでは文書構造を取得するヒントとなるものが存在しないため、単純に〈P〉タグだけで出力されていることがわかります。

以上、簡単なタグ付け内容の参照方法となります。


続・OCRのよもやま話

先日、JR東海から2027年度に開業が予定されるリニア新幹線の概要が発表されました。多くのメディアで取り上げられましたので興味を持って見られた方も多かったのではないでしょうか?
弊社の伊那支店がある長野県南部にもリニア新幹線の新駅ができる計画で、地元紙でも大々的に記事が掲載されました。これまで夢としてしか語られなかったことがにわかに現実味を帯びてきたことで、谷あいののどかな地方にこれからどのような風が吹きこむのか、住人としても目が離せない気がします。

閑話休題。

昨年の7月頃に『OCRのよもやま話』という記事を書きました。
今回はその続きということで、OCRにまつわる話題をいくつか追加したいと思います。

OCRと解像度

OCRとは、Optical Character Recognition(あるいはReader)の略で、紙に印刷された文字をイメージスキャナなどで読み取り、画像化された情報から文字情報を抽出する技術であることを以前の記事でご紹介しました。

OCRで文字を正確に取り出すために必要な要素を考えると、おおよそ以下の点が挙げられると思います。

  1. 元になる原稿の状態が良好であること(文字が鮮明で、紙に汚れや皺がないなど)
  2. 適切な解像度でスキャンされていること
  3. OCRソフトが適切な性能であること

このうち、2)の「解像度」について取り上げます。

OCRで使う解像度はスキャナなどで取り込む画像の品質を表すもので、dpi(ディーピーアイ)という単位を使います。これは、1インチ(2.54cm)の間隔にどれだけ物理的な点(画素)が配置されているかを示すもので、同じ大きさの画像で比べた場合は、解像度の値が大きいほど高精細な画像が得られます。

解像度は別の言い方をすると、1インチあたりの画素の密度を表すということができます。密度が濃ければそれだけ細かい描写が可能になります。以下はそれを模式図にしたものですが、文字のサンプルにあるように解像度が小さいと曲線などで滑らかな表現ができなくなります。

解像度

解像度

では、実際に異なる解像度でスキャナから取り込んで比較してみましょう。

以下は、スキャナの設定でそれぞれ 200dpi/400dpi に解像度を変更してJPEG形式に保存したデータの一部を示しています。

解像度の違い

解像度の違い

ちょっと分かりづらいかも知れませんが、ブラウザの表示倍率をあげて見ていただくと両者の違いが分かります。
以下は、この二つの画像を弊社のOCR変換製品『瞬簡PDF OCR』でテキストファイルに変換した結果です。

変換結果

変換結果

解像度が200dpiだと文字化けしてしまう箇所が、400dpiでは(完全ではないですが)おおむね正しく認識できていることが確認できます。

そうすると、もっと解像度を高くしてスキャンすれば更に良い結果が出せそうに思えます。ところが、これがさにあらず、なのです。
以下は、スキャナの設定を600dpiにして変換を行った結果です。

600dpiで変換

600dpiで変換

解像度を上げても、あまり変換結果に影響がないことが確認できるかと思います。
一般にOCR処理では、300~400dpiの範囲が適切なOCR結果を得る解像度だと言われています。それ以上解像度を上げてもファイルサイズが大きくなるばかりで、OCRの変換精度はあまり変わらないか、逆に悪くなってしまう場合もあります。ちなみに今回使用したJPEGデータの場合、400dpiのときのファイルサイズは約1.4MBですが、600dpiでは約2.7MBでした。

OCR処理を使って文字の取り出しを行う際には、スキャンの段階から適切な解像度を設定していただくことでより良い結果が得られます。ご参考にしていただければ幸いです。

※『瞬簡PDF 変換8』、『瞬簡PDF OCR』は製品の体験版を公開しております。是非、お試しください。


Pages: 1 2 Next