月別アーカイブ: 2013年9月

続・OCRのよもやま話

先日、JR東海から2027年度に開業が予定されるリニア新幹線の概要が発表されました。多くのメディアで取り上げられましたので興味を持って見られた方も多かったのではないでしょうか?
弊社の伊那支店がある長野県南部にもリニア新幹線の新駅ができる計画で、地元紙でも大々的に記事が掲載されました。これまで夢としてしか語られなかったことがにわかに現実味を帯びてきたことで、谷あいののどかな地方にこれからどのような風が吹きこむのか、住人としても目が離せない気がします。

閑話休題。

昨年の7月頃に『OCRのよもやま話』という記事を書きました。
今回はその続きということで、OCRにまつわる話題をいくつか追加したいと思います。

OCRと解像度

OCRとは、Optical Character Recognition(あるいはReader)の略で、紙に印刷された文字をイメージスキャナなどで読み取り、画像化された情報から文字情報を抽出する技術であることを以前の記事でご紹介しました。

OCRで文字を正確に取り出すために必要な要素を考えると、おおよそ以下の点が挙げられると思います。

  1. 元になる原稿の状態が良好であること(文字が鮮明で、紙に汚れや皺がないなど)
  2. 適切な解像度でスキャンされていること
  3. OCRソフトが適切な性能であること

このうち、2)の「解像度」について取り上げます。

OCRで使う解像度はスキャナなどで取り込む画像の品質を表すもので、dpi(ディーピーアイ)という単位を使います。これは、1インチ(2.54cm)の間隔にどれだけ物理的な点(画素)が配置されているかを示すもので、同じ大きさの画像で比べた場合は、解像度の値が大きいほど高精細な画像が得られます。

解像度は別の言い方をすると、1インチあたりの画素の密度を表すということができます。密度が濃ければそれだけ細かい描写が可能になります。以下はそれを模式図にしたものですが、文字のサンプルにあるように解像度が小さいと曲線などで滑らかな表現ができなくなります。

解像度

解像度

では、実際に異なる解像度でスキャナから取り込んで比較してみましょう。

以下は、スキャナの設定でそれぞれ 200dpi/400dpi に解像度を変更してJPEG形式に保存したデータの一部を示しています。

解像度の違い

解像度の違い

ちょっと分かりづらいかも知れませんが、ブラウザの表示倍率をあげて見ていただくと両者の違いが分かります。
以下は、この二つの画像を弊社のOCR変換製品『瞬簡PDF OCR』でテキストファイルに変換した結果です。

変換結果

変換結果

解像度が200dpiだと文字化けしてしまう箇所が、400dpiでは(完全ではないですが)おおむね正しく認識できていることが確認できます。

そうすると、もっと解像度を高くしてスキャンすれば更に良い結果が出せそうに思えます。ところが、これがさにあらず、なのです。
以下は、スキャナの設定を600dpiにして変換を行った結果です。

600dpiで変換

600dpiで変換

解像度を上げても、あまり変換結果に影響がないことが確認できるかと思います。
一般にOCR処理では、300~400dpiの範囲が適切なOCR結果を得る解像度だと言われています。それ以上解像度を上げてもファイルサイズが大きくなるばかりで、OCRの変換精度はあまり変わらないか、逆に悪くなってしまう場合もあります。ちなみに今回使用したJPEGデータの場合、400dpiのときのファイルサイズは約1.4MBですが、600dpiでは約2.7MBでした。

OCR処理を使って文字の取り出しを行う際には、スキャンの段階から適切な解像度を設定していただくことでより良い結果が得られます。ご参考にしていただければ幸いです。

※『瞬簡PDF 変換8』、『瞬簡PDF OCR』は製品の体験版を公開しております。是非、お試しください。


Windows 8.1 Preview の PDF 表示機能

PDF 表示機能の比較
https://blog.antenna.co.jp/ILSoft2/archives/779
の続きです。

Windows 8.1 Preview の Windows Reader でサンプル PDF (http://ondoc.logand.com/d/223/pdf)を開いてみました。

win8_1_test_pdf

右上のあたりで色が少し違うのと、縦書き文中の括弧の向きがおかしいのは Windows 8 の時と同じですが、
右下の「Text Image」と表示されるはずの部分が空白になっています。
Windows Reader は Windows 8 から 8.1 のバージョンアップで変化があることは確認できましたが、
このサンプルの表示に限っては、劣化していると言えるでしょう。


画像ファイルをスタンプ注釈に利用 PDF Tool 「V4」(もうまもなく)

私の住んでいる地域のコンビニ各社では淹れたてコーヒーの価格差がなくなり100円になりました。
次なる差別化はコーヒーにおつまみをつけるか否かということになってきています。

さて、「PDF Tool」は現在、V4リリースに向けて作業を行っています。
リリースのご案内は10月中旬頃にはできるかと思います。しばらくお待ちください。

V4の新たな機能として画像から直接PDFを作成したり、画像やPDFをスタンプ注釈にするというものがあります。
下記PDFは画像を直接PDF化し、画像をスタンプ注釈として貼り付けたものです。

スタンプ注釈(例)

スタンプとして用いた画像


スタンプしたpdf

スタンプしたpdf

●製品詳細ページ
『Antenna House PDF Driver API / Antenna House PDF Tool API 』

●無償の評価版をぜひお試しください! 
『Antenna House PDF Driver API / Antenna House PDF Tool API』評価版


AH Formatter V6.1 MR2リリース~FormatterClub「CSS書籍組版」セミナーの案内

AH Formatter V6.1 MR2(改訂2版)を公開しました。詳しくは改訂情報のページをご覧ください。
AH Formatter V6.1 改訂情報

評価版は以下のページよりお申し込みいただけます。
AH Formatter V6 評価版のお申し込み

これまでも紹介してきましたが、AH Formatterは、XMLやHTMLで書かれた文書をレイアウトして高品質な印刷・PDF生成を行うことができる自動組版エンジンとして、日本だけでなく世界で使われています。

FormatterClubのすすめ~10/18「CSS書籍組版」セミナー予告

AH Formatterをもっと知りたい、試してみたい、使っている人に聞きたいという方にFormatterClubをお勧めします。
会員(無料)には会員向け試用版の提供をしています。通常評価版では出力ページに「すかし」が入りますが、この会員向けはページの下部にAH FormatterのURLが表示されるだけになり、この表示を改変・削除しない限りにおいて、評価用に利用することのほか、個人的に文書作成に利用するなど、非営利目的に限って使用することが可能です。

FormatterClubについて

FormatterClubでは不定期ですが例会セミナーを開催してます。
次回は10/18(金)に「CSS書籍組版」をテーマで開催予定です。

日時:2013年10月18日(金)14:00-16:30
場所:浜町区民館

講師には『ページ組版のためのCSS指南』編著者、藤島雅宏さん(イーエイド

[書籍紹介] ページ組版のための CSS 指南

「CSS」というと、Webページのレイアウトのためのスタイルシート仕様ですが、この仕様の中にはCSS3 Paged MediaGCPMなど印刷・ページ組版のための機能もあり(ドラフト段階ですがAHは先行実装してます)、これを利用するとHTML+CSSで書籍の組版が可能です。実際、オライリーの書籍などCSS組版で作られて出版されているのですが、まだまだあまり知られていません。
このセミナーでは、CSS組版でここまでできるということを紹介し、その問題点や可能性を話しあえればと考えています。

詳しくは、案内ページへ:
FormatterClub「CSS書籍組版」セミナーご案内(無料セミナー)


PDF/UA(ISO 14289-1)について(終)

PDF/UAの紹介の最後になります。

ここまで、ファイルフォーマットの要件、リーダの要件を記載しましたが、最後はAT(Assistive Technology:支援技術)の要件になります。

このATにはPDF/UAを使用するスクリーンリーダや、音声入力をサポートするデバイス、キーボード入力を容易にする装置、点字に変換して印刷するソフトウェアなど広範なソフトウェア、ハードウェアが含まれます。

ATに求めら得る要件とは、大きくは下記となります。

  • この仕様に定められた構造型、属性、値をユーザが好む方法で利用、表示できること、論理構造ツリーに属さないアーティファクトを処理する機能があること。
  • 準拠リーダが複数の表現方法で表示する場合、ATはユーザの選択する方法でその表現にアクセスすることを可能としなければならない。
    (この複数の表現方法とは、PDFのオプショナルコンテントあるいはレイヤーなどと呼ばれる機能を使用した表現方法のことです)
  • ナビゲーション機能として、以下をサポートする必要があります。
    • PageLabel数値ツリーを用いてナビゲーションする機能
    • 構造階層を用いてナビゲーションする機能
    • ドキュメントのアウトライン(Adobe Readerのしおり)を用いてナビゲーションする機能
    • ユーザ指定に応じたズーム機能

PageLabelとは、たとえば、目次部分は小文字のアラビア数字、本文はローマ数字といったページ番号を持つ文書がありますが、PDFでそのような表現をする機能です。ナビゲーションに、このPageLabelや、文書の章・項といった論理構造の階層情報を使用する機能が必要とされます。

ATの要件については、あまり詳細なことは定められていません。

以上、PDF/UAの紹介となりますが、フォーマットの要件部分で、関連仕様に W3Cの Web Content Accessibility Guidelines(WCAG) 2.0 があることを記載しました。
これまで説明したPDF/UAファイルの作成、使用の双方に必要とされる要件は、PDFファイルをW3Cの勧告であるWCAGに沿って利用するために必要とされるPDFの機能の使用方法となります。

PDF/UAの理解には、WCAG 2.0 (およびその関連ドキュメント)で解説される内容を理解する必要があります。
WCAGのW3Cの勧告は下記にありますので、興味のある方は参照ください。
http://www.w3.org/TR/2008/REC-WCAG20-20081211/
(日本語訳)
http://www.jsa.or.jp/stdz/instac/commitee-acc/W3C-WCAG/WCAG20/


PDF/UA(ISO 14289-1)について(3)

間があいてしまいましたが、以前のPDF/UAの紹介の続きになります。
PDF/UA(ISO 14289-1)について
PDF/UA(ISO 14289-1)について(2)

今回は、PDF/UAのリーダ側の要件をまとめてみます。

全体としては、ISO 32000-1:2008で定義されているドキュメントの論理構造とアーティファクトを処理する能力を持つこと、および、ATとのインターフェース機能を持つこと、とあります。

AT(Assistive Technologies:W3CのWCAG2.0の邦訳では「支援技術」という用語が使用されていました。)とのインターフェース機能とは、

  • 構造タグのタイプ、属性、およびキーの値に対するアクセスの提供およびオプショナルコンテントグループの可視状態を考慮した表示能力
  • アーティファクトをATが利用できるようにすること
  • ユーザインタフェースが存在する場合、それをATが利用できるようにすること

とあります。
(ここの「アーティファクト」ですが、PDFではドキュメントの著者によるオリジナルのコンテント(リアルコンテント)以外の、ページ付けやレイアウトのために生成されたオブジェクトをアーティファクトと呼んでいます)

以下、PDFの各オブジェクトに対して個別に記載されている要件となります。

テキスト

・論理的な読み込み順番をATデバイスが利用可能であること
・文字コードを適切に処理する能力があること
・自然言語、およびその変更をATデバイスが利用可能であること
表のセルが空である場合、その情報をATデバイスが利用可能であること
オプショナルコンテント
オプショナルコンテントを含む場合、複数の表現が選択可能となることがあるが、すべてのオプショナルコンテントを表示する手段を提供し、オプショナルコンテントコンフィギュレーション辞書の階層を表示する手段を提供すること
(このようなドキュメントの例として、多言語ドキュメントで、オプショナルコンテントを使用して、各言語別の表現をサポートしているようなドキュメントがあります)
添付ファイルと埋め込みファイル
  • 構造ツリーに存在していない添付ファイルを利用可能とすること
  • 埋め込みファイルの名称を表示するためにメカニズムを提供すること
デジタル署名
デジタル署名されていることをユーザに報告し、デジタル署名の証明書属性と有効性の状態を提示できること
アクション
アクションがドキュメントの可視状態を変更する場合、ATがその変更を利用できること
メタデータ
ドキュメントのCatalog辞書のMetadataストリームにおけるすべての要素をATが利用できること
ナビゲーション
論理階層構造やしおりを使用してナビゲートする機能を持つこと
注釈
各注釈の代替え記述をATデバイスに利用可能とすること
フォーム
ウィジェット注釈のテキスト記述をATデバイスに利用可能とすること
マルチメディア
動的にではなくユーザの要求に応じて再生すること

PDF/UAの読み手にはこれらの機能が必要とされています。


「Adobe、Readium Foundationに参加」とのこと

おはようございます。CAS-UB営業担当です。
今日の徒然は、一昨日の記事を紹介します。Googleアラートで設定したキーワード「ebook」に引っかかったものです(世の中本当に便利になりました。ますます怠惰になりそうです)。

出所は電子書籍関連の情報を集めるならば多分誰もが覘くであろう「ITmedia eBook USER」から。
タイトルはそのまま「Adobe、Readium Foundationに参加」。

EPUBリーダーについて、Adobeは「Adobe Digital Editions」(現行バージョンは2)という、独自のリーダーを持っていますが、EPUB閲覧、活用性能は、ReadiumやiBooksに較べるとよいとは言えません。

乱立していたEPUBリーダーが、iBooks、Readium系に集約しつつあると見てよいのでしょうか。どちらもWebkitをベースにしているので、大元の開発元であるAppleの応用力の高い技術力のすごさがわかります。

Adobeがこうして、EPUBリーダープロジェクトに参加することで、「PDF=Adobe」だったのが、「PDF/EPUB=Adobe」になったりするのかもしれません。
弊社のような、独自でEPUB制作ツールを開発している会社にとっては、由々しき問題で、もともとのeBook関連制作会社にとっては、ツールが一つに統一できるため、喜ばしきことなのか…。

しかし、各リーダーでの見え方が統一されるのは、弊社としても(検証の手間が省けるため)いいといえばいいのです。
素直にEPUBの未来展望に思いを馳せられないため、もやもやと不完全燃焼です。


電子書籍の「言い値」課金モデル

おはようございます。CAS-UB担当営業です。

「PWYWモデル」という電子書籍の課金モデルをご存知でしょうか(恥ずかしながら、昨日そういうものがあることを知りました…)。日本語では、「言い値モデル」と訳されています。

「言い値」というと、ずいぶん読者に有利なように感じますが、実際にそれで商売が成り立つんでしょうか。売り手にも買い手にも、相応の知識といいますか、共通の認識、若しくは価値観なりを持っていないと成り立たなさそうに感じます。

欧米では、大学などへの電子教科書レンタルで見ることができるようです
(ITmedia eBook USER 1月23日記事:電子書籍の“言い値”販売競争が本格化へ、GumroadとAmazonが密かにサービス駆け引き)。

類似でイスラエルの「Total Boox」が「読んだ分だけ課金する」(書籍全体の10%を読んだら、書籍1冊分の価格の10%を支払い、20%読んだら価格の20%を支払う)というサービスを展開しています。

日本でも、実験的に行っています(これが昨日見た記事です)。
その名も「言い値書店」。サービスを開始してから6か月ほど経つそうで、今のところ、個人作家作品が主体のようです。
電子書籍として、PDF、TXT、EPUB、MOBI ファイル形式が対象ですが、現在はPDFが主です。これからEPUBなどが増えるのでしょう。

hon.jpが『個人作家のためのPWYWモデル入門』の実験6結果を追加・公開
hon.jp DayWatch(2013-09-09 09:55:47)

CAS-UBは、販売には直接かかわりませんが、こうして電子書籍をPDF/EPUB/MOBIなどで出したい作家さんを応援する「電子書籍編集・制作Webサービス」です。
画像をアップロードして、1ページ1枚、画像だけの電子書籍を作ることも、会社の資料をアップロード、EPUB出力して携帯端末で打ち合わせ前に確認したりすることもできます。もちろん、小説や論文だって作れます。
是非一度、お試しください。

クラウド型電子書籍編集・制作サービス:CAS-UB
お試しライセンス(30日)お申込みページ


マルチTIFFを複数ページのPDFに変換できる


XMetaL 8J(XMetaL日本語版)スクリーンショット

今年の3月にXMetaL 8 の英語版がリリースされ、それ以来開発元のジャストシステムカナダに日本語版を早く出すよう再三リクエストしてきました。もうそろそろXMetaL 8 の日本語版が正式リリースされるはずなのですが、まだ開発元から連絡がありません。

待ちきれないので少々フライング気味ですがスクリーンショットを少しだけリークします。
なお、このスクリーンショットはテストバージョンのもので、正式版では多少違うところがあるかもしれません。

まずは挿入メニュー。

insert

insert

次にマップエディタの中のファイルメニュー

mapeditor

mapeditor

最後にオンラインヘルプ

help

help

エディターの操作って所詮慣れの問題なので、英語版でもそれほど問題ないのではないかと思っていたのですが、こうして日本語になったものを見ると、やっぱりいいですねえ。とくにオンラインヘルプが日本語化されたのは個人的に大歓迎です。やっと読む気になりました(笑)

本当に、もう間もなく正式版が出て来るはずですので、もう少しご辛抱ください。


Pages: 1 2 Next