カテゴリー別アーカイブ: 瞬簡PDF 変換

新発売『瞬簡PDF 変換 7』は、透明テキスト付きPDF作成にもひと工夫!!

新発売の『瞬簡PDF 変換 7』では、透明テキスト付きPDFの作成処理に新しい機能を追加しています。

  • 透明テキスト付PDFとは、スキャナーで読み取った画像をOCR機能をつかって文字を認識し、コード化した情報(テキスト)として、PDFの画像の上に透明属性を持たせて重ねたものを指します。
    PDFファイルの内容である文字情報を利用したいときは、テキストを取り出して利用できます。また、PDFファイルの中を検索してヒットした文字列の該当部分を反転表示することもできます。

具体的に説明します。

以下は本製品のユーザーマニュアルの一部ですが、通常の文字と画像が混在した構成になっています。

文字と画像が混在したPDF
文字と画像が混在したPDFの例
(画像をクリックすると拡大します)

このような場合、既にテキストがページ上にあるので(図では反転表示にしています)、このままで文字列を検索することが可能です。
しかし、画像部分にある文字も検索対象にしたいといったときはどうでしょう?
そのような場合、通常は、このページ全体を画像化してOCR処理でテキストを取り出します。

そうすると、画像部分の文字もテキスト化できますが、元からあるテキスト部分もOCR処理することになり、場合によっては誤認識で文字化けしてしまう可能性があります。
また、ページを画像化することで、このページにあるしおりの情報(図の左側に表示されているツリー上の見出し部分)も失われてしまいます。

『瞬簡PDF 変換 7』では、透明テキスト付きPDFの作成時に、[元の情報を保持してOCR結果を埋め込む]という機能を選択できます。

透明テキスト付きPDFのオプション

これは、PDFの元の情報を保持したまま、ページ内にある画像だけOCR処理をして、その結果を透明テキストとして一緒にPDFに埋め込み、保存するというものです。
先ほどのPDFをこの機能をオンにして、変換してみます。

透明テキスト付きPDF
画像部分に透明テキストを埋め込んだPDFの例
(画像をクリックすると拡大します)

図で、反転表示している箇所がテキストになります。画像上の文字に対してもテキスト化されているのがお分かりになると思います。
また、ページの左側にある、しおり情報がそのまま保持されている点にもご注目ください。

様々な情報をPDF化してパソコンに蓄積し、必要なときに取り出して参照する方法は、たいへん便利なものです。
それには、多数のPDFファイルから必要なものを探し出せるように、検索性の高いPDFを作成することが重要になってきます。
既存のPDFのテキストデータを生かし、さらに画像化された文字までテキストデータとして検索可能にするこの機能を、PDFご活用にお役立てください。

『瞬簡PDF 変換 7』の透明テキスト付きPDF作成機能について、詳細はOCRによる透明テキスト付きPDFの作成をご参照ください。
明日はPDFからExcelへの変換時の改善についてご説明します。


新発売『瞬簡PDF 変換 7』は、OCR処理を高速化!!

10月14日から販売開始した『瞬簡PDF 変換 7』では、OCR処理を見直し、画像化されたPDFから従来の製品より正確な文字認識処理を行うことができるようになりました。さらにOCR変換時の処理速度も大幅にアップしました。
下のグラフは、旧製品(リッチテキストPDF6.1)と『瞬簡PDF 変換 7』を使用して、画像データを既定の条件でWordへ変換した結果を比較したものです。

旧製品との速度比較
旧製品と『瞬簡PDF 変換 7』のOCR変換速度比較
(画像をクリックすると拡大します)

平均して、OCRを使用した変換では旧製品比で40~50% の速度アップを実現しています。この数値は、実行環境や元画像の状態、自動で回転や傾き補正を行うかどうかなどの条件によっても異なってきますが、多くの場合で処理速度の向上を実感していただけるものと思います。

また、操作画面においてもOCR処理がしやすくなる改善を行っております。

OCR変換条件の設定
(画像をクリックすると拡大します)

これまで、OCRを行う際の変換条件は、画面上に登録された複数のファイルに対して一括で適用されるようになっていましたが、今回これを見直して、ファイル個別に変換条件を指定できるようにしました。
手順としては、

  1. 最初にメニューバーから[ツール]→[OCR設定の既定値…]を選択します。これにより全体のOCR変換条件を指定できます。
    例えば、日本語文書を変換する機会が多い場合は、言語指定で[日本語]を選択して置きます。
  2. 次に登録されたファイル欄に表示された[OCR設定]ボタン(上図で赤枠内にあるオレンジ色のボタン)をクリックします。これによりファイル毎に異なるOCR変換条件を指定できます。
    例えば、選択したファイルが他と違い英文の文書であったなら、OCR変換条件で言語指定を[英語]に変更します。

このように指定を行ってから[実行ボタン]をクリックすると、ファイル毎に指定した条件により、OCRを利用した変換処理が一括で実行できます。

『瞬簡PDF 変換 7』について、詳細は製品紹介サイトをお訪ねください。
明日は透明テキスト付きPDF作成時の改善についてご説明します。


PDFをOfficeファイルに高精度変換!!  『瞬簡PDF 変換 7』 新発売

アンテナハウスでは、PDFをWordやExcelに変換して再編集可能にするソフト『瞬簡PDF 変換 7』を10月14日に販売開始しました。

先行してダウンロード版を発売し、パッケージ版は10月21日から出荷を開始していますので、このブログが掲載される頃には店頭で新しいパッケージを見ることができるかも知れません。

リッチテキストの名前が消えた!?

これまで弊社の『リッチテキストPDF』シリーズをお使いいただいていたユーザー様は、今回の製品名をみて「あれ!?」と思われたかも知れません。そうです、今回より製品名から『リッチテキスト』の文字が消えてしまいました。

『リッチテキストPDF』シリーズは2005年の6月に最初のバージョンを発売しまして、これまで何度も改良を重ねて参りました。PDFからOffice文書に変換するソフトウェアとしては、けっこう老舗の部類に入ると思います。
また、最初のバージョンは日経誌の記事”PDFをWordファイルに見事に変換「リッチテキストPDF」“にも取り上げられて、ここでお褒めをいただいたことや、ご指摘を受けたことなどが、以後の開発に随分と励みになったものです。

そのような、歴史?のある「リッチテキスト」の名称を今回使用しなかったのは、「瞬簡PDF」シリーズへの統合をより明確にするためでした。

『瞬簡PDF 変換』という命名には、ビジネスや日常で欠かせないものになってきたPDFの活用をサポートするツールとして、アンテナハウスがどのような製品を提供し、それで何ができるかを、分かりやすく明快にお客様にお伝えしたいとの思いを込めています。

「瞬簡」は、「瞬時」に「簡単」からなる造語です。「瞬簡PDF」という名称を共通に冠した弊社製品群が、この名に恥じないように、お客様のPDFご活用の一助となれば幸いに存じます。

今回の新製品では、今ご覧いただいているブログの右側を見ていただくとお分かりいただけますように、「瞬簡PDF 作成」と「瞬簡PDF 変換」のパッケージもこれまでと違って、幅の広い存在感のあるものにリニューアルしました。さらに、企業・官庁様向けに”超”お得な価格設定を新規に導入するなど、全体に力の入ったものとなっています。

さて、外側の話しはこれくらいにして、明日からは、内部でどのような改善を行ったかにつきまして、ご説明していきたいと思います。次回も是非お読みください。


Pages: Prev 1 2 3 4 5 6