カテゴリー別アーカイブ: 瞬簡PDF 変換

新製品 PDF変換ユーティリティ『瞬簡PDF 変換 8』(2)

昨日に引き続き、PDF変換ユーティリティ『瞬簡PDF 変換 8』の新機能、テンプレートファイル読み込み機能についてご説明します。

『瞬簡PDF 変換 8』は、PDF内部にテキストデータがあるとき、その情報から文字・段落・表・画像など文書を構成するのに欠かせない要素を抽出してWordなどのファイル形式に変換します。
一方、紙の書類をドキュメントスキャナでスキャンしてPDF化したデータでは、中身は画像だけとなり文字や線などの情報は皆無です。
そのままでは変換先にも画像データしか渡らないため、本製品では内蔵したOCR(光学式文字認識)処理で画像から文字や線と思われる情報を識別して、変換先に文字や罫線を移し編集可能な文書を生成します。

しかし、OCR処理ではその特性上、画像の状態(解像度が低い、傾きや汚れがあるなど)によって元の書類では表になっている範囲(領域)を画像として認識したり、その逆に画像の領域を文字として認識したりといったことがあります。
これまでは、こういった領域の誤認識があってもそのまま変換してしまうため、変換先で編集がしづらくなってしまう場合がありました。

このような問題を解消するため、『瞬簡PDF 変換 8』で新たに追加した機能が「テンプレートファイル読み込み」機能です。

テンプレートファイルとは、OCR処理専門の姉妹製品『瞬簡PDF OCR』を使い、画像データに対して行った領域解析結果を外部のファイルに保存したものです。
『瞬簡PDF OCR』では画像を表示しながら自由に文字や画像や表の領域を指定できて、その情報をテンプレートファイルに保存することができます。
それを『瞬簡PDF 変換 8』で読み込んで同じデータに適用することで、領域の誤認識なく変換を行うことが可能になります。

概要を以下にまとめましたので、ご覧下さい。

テンプレートファイル読み込み

なんだ、それだけなら最初から『瞬簡PDF OCR』を使って変換してしまえば済む話しじゃないか、と思われることでしょう。

この機能が威力を発揮するのは、帳票など同じ書式で大量の紙文書があるような場合です。
それらをまとめて、例えば Excel に移して管理したいといったような状況で、できるだけ誤変換がないように変換したいとき、この機能が役立ちます。
『瞬簡PDF 変換 8』は複数ファイルの一括変換に適したユーザーインタフェースを備えていますので、同じようなレイアウトの複数PDFを一括で登録し、これにひとつのテンプレートファイルを適用して変換することで、あとの編集作業を大幅に省力化することが期待できます。

弊社では、『瞬簡PDF OCR』と『瞬簡PDF 変換 8』を含めてたいへんお得な価格にまとめた『瞬簡PDF 統合版 6』もご用意しております。是非この機会にこれらの製品をご利用いただき、PDFを自由自在に活用することをご検討ください。


新製品 PDF変換ユーティリティ『瞬簡PDF 変換 8』(1)

本日は、12月に公開したばかりのPDF変換ユーティリティ『瞬簡PDF 変換 8』についてご紹介します。

『瞬簡PDF 変換 8』のパッケージは今月下旬から店頭に並ぶ予定ですが、既に今月3日から弊社オンラインショップで先行して
ダウンロード販売を開始しております。
また、今週17日からは体験版の公開も始めましたので、既に使用されている方もおられるかと思いますが、
ここであらためてその内容についてご紹介させていただきたいと思います。

『瞬簡PDF 変換 8』は、PDFをマイクロソフトのWord(ワード)、Excel(エクセル)、PowerPoint(パワーポイント)や
ジャストシステムの一太郎に変換して、PDFの内容を編集可能にするためのソフトウェアです。
前身の『リッチテキストPDF』は2005年から発売開始されましたので、かれこれ7年余りに渡ってバージョンを重ね、開発を継続してきた
「老舗」のようなPDF変換ソフトになるかと思います。
とはいえ名前に安住せず、これまで版を重ねるごとに変換精度にも磨きをかけ今日に至っております。

新バージョンでは、中核となる変換エンジンに改善を加えるとともに、OCR処理の面でもひとつの試みを加えております。
それは、今年8月に発売した弊社のOCR専用製品『瞬簡PDF OCR』を利用するものです。

『瞬簡PDF OCR』は、スキャナから取り込んだ紙の原稿データ、PDF、画像ファイルにOCR(光学式文字認識)処理を行い、Office(Word、Excel、PowerPoint)ファイル、透明テキスト付きPDFなどに変換する、活字OCR変換ユーティリティです。
『瞬簡PDF OCR』で保存したテンプレートファイルを『瞬簡PDF 変換 8』でも利用可能にすることで、OCR処理(画像データからの文字認識処理)で起きる文字の誤変換を大幅に改善できるようにしました。

機能の詳細につきましては、明日またこの続きでご覧ください。

瞬簡PDF 変換8 製品ページ


瞬簡PDF活用教室 第2回 『瞬簡PDF 変換7』 デモムービーを公開!

瞬簡PDF活用教室 第2回は、PDFからOffice文書へ変換する、『瞬簡PDF 変換7』を、動画でご紹介します。
全部で5回、それぞれ約2分程度の構成ですので、ちょっと時間のあいたときにでもご覧いただければ幸いです。
■『瞬簡PDF 変換7』 イントロ
~瞬簡PDF活用教室 第2回 の構成について、簡単に紹介します~

■ 瞬簡PDF活用教室 第2回 PDF→Word 変換
~『瞬簡PDF 変換7』を使って、PDFを Word ファイルへ変換するデモをご覧頂けます~

■ 瞬簡PDF活用教室 第2回 PDF→Excel 変換
~『瞬簡PDF 変換7』を使って、PDF を Excel ファイルへ変換するデモをご覧頂けます~

■ 瞬簡PDF活用教室 第2回 PDF→PPT 変換
~『瞬簡PDF 変換7』を使って、PDF を Power Point ファイルへ変換するデモをご覧頂けます~

■ 瞬簡PDF活用教室 第2回 評価版と価格について
~『瞬簡PDF 変換7』 の評価版と製品価格について、ご案内いたします~

■瞬簡PDF 変換7 製品紹介ページ
http://www.antenna.co.jp/pdftooffice/
■お問合せ先
 e-mail :sales@antenna.co.jp
 電話番号:03-5829-9030


新発売『瞬簡PDF 変換 7』は、たいへんお買い得!!

新発売の『瞬簡PDF 変換 7』は、これまでよりお求めやすい割安な価格設定といたしました。

これは、PDF作成・編集ソフト『瞬簡PDF 作成 5』を今回より同梱せず、単体販売としたことによるものですが、これまで「瞬簡/リッチテキストPDF6(6.1)」をお使いいただいていたユーザー様には、『瞬簡PDF 作成 5』を廉価でご提供するサービスもご用意しておりますので、合わせてご利用ください。

また、他のアンテナハウス製品を既にお使いのお客様にも、『瞬簡PDF 作成 5』と『瞬簡PDF 変換 7』を割安な価格でご提供しておりますので、この機会に是非ご検討ください。
ご購入に関して、詳しくは、アンテナハウス オンラインショップをご参照ください。

さらに今回より、『瞬簡PDF 変換 7』を含めたアンテナハウスのデスクトップ製品を複数ライセンスでご利用されたい企業・自治体・官公庁・団体ユーザー様を対象に、これまでとはまったく異なる体系でボリューム・ライセンスをご用意しております。

新しいライセンス体系には、大きく分けて以下の3つがあります。

  1. AH-ULL:61ライセンス以上をお求めの企業・自治体・官公庁・団体ユーザー様向けで、“超お買い得な“価格体系となっています。
  2. サイトライセンス:10ライセンス以上のまとまった数量をお求めのお客様向けで、シンプルなライセンス単価を適用しています。
  3. シンクライアントライセンス:シンクライアント環境で利用するためのライセンスです。

最初の”AH-ULL”は、”エーエイチ・ユーエルエル”と発音します。聞き慣れないものですが、Antenna House-Unlimited License の略です。
多数のライセンスを使用する事業所の規模に応じて3つのタイプ(AH-ULL200/500/1000 )が用意されていて、それぞれ上限のライセンス内で無制限に弊社製品を使用可能になっております。

これらのライセンスについて、詳細は新ライセンス体系についてをご参照ください

これまで5日間に渡って、新製品『瞬簡PDF 変換 7』をご紹介させていただきました。弊社では今後とも改善を継続してよりよい製品をお客様にお届けするとともに、皆様のお役に立てる新しい機軸の製品開発も進めていく所存です。今後とも応援いただけますよう、よろしくお願いいたします。


新発売『瞬簡PDF 変換 7』では、Excelへの変換も改善しました!!

新発売の『瞬簡PDF 変換 7』では、変換精度向上のための改善をしています。

例えば、Excelへの変換では、以下の2点改善を行っています。

  • PDFで縦書きのテキストをこれまでシート末尾にまとめて変換していましたが、Excelで縦書きテキストボックスを作成してシート上に配置するようにしました。
  • 平方メートル、立方メートルなどの単位がこれまで[m][2]で別々の行に変換されていたものを1行にまとめるようにしました。

ひとつめは、PDF上に以下のような方向でテキストが記述されていた場合についての改善です。

縦書き文字列の例
縦書きの文字列の例

このようなレイアウトはExcelのセルでは再現が難しいため、これまではシートの末尾に横書きテキストとしてまとめて出力していましたが、『瞬簡PDF 変換 7』では、縦書きのテキストボックスをそれぞれに作成し、その中にテキストを変換するようにしました。
Excelではセルによってテキストを配置しますので、テキストボックスでは必ずしも元のPDFのレイアウトを再現できませんが、縦書きテキストをテキストボックスにまとめることにより、これまでより変換後の編集がしやすくなりました。

ふたつめは、工事設計書などで良く見かける面積や体積の単位に関する改善です。以下の例をご覧下さい。

面積、体積単位の例
面積、体積の単位が使用されたPDFの例
(画像をクリックすると拡大します)

平方メートルや立方メートルの単位は、PDFに”㎡”のように文字コードで格納されていればそのまま変換されますが、”m”+”2″のように別々の文字として格納されて、”2″の方に上付きの位置が与えられていると、それぞれ別個に認識して別々に変換されます。

上記の例のようなPDFでは、これまで以下のように変換されていました。


瞬簡/リッチテキストPDF6.1の変換例

これまでの変換では、”m”を含む行と”3″を含む行が別々になっています。これだと、Excel上で”3″部分を選択して上付き属性を付加するといった編集作業が簡単にできません。

そこで、『瞬簡PDF 変換 7』では、以下のような変換結果となるように改善しました。

瞬簡PDF 変換の変換例
瞬簡PDF 変換 7の変換例

これにより、”m”と”3″が1行にまとめられて、Excel上での編集もしやすいものとなります。

まだまだご紹介したい改善事項がいくつもありますが、紙数が尽きましたので、今日はこのへんで。
『瞬簡PDF 変換 7』の変換例について、詳細はPDF、画像ファイルからOfficeへ逆変換や、瞬簡PDF 変換 7 は国産最高の変換精度!をご参照ください。
『瞬簡PDF 変換 7』ご紹介の最後は、新製品の価格設定についてご説明させていただきます。


新発売『瞬簡PDF 変換 7』は、透明テキスト付きPDF作成にもひと工夫!!

新発売の『瞬簡PDF 変換 7』では、透明テキスト付きPDFの作成処理に新しい機能を追加しています。

  • 透明テキスト付PDFとは、スキャナーで読み取った画像をOCR機能をつかって文字を認識し、コード化した情報(テキスト)として、PDFの画像の上に透明属性を持たせて重ねたものを指します。
    PDFファイルの内容である文字情報を利用したいときは、テキストを取り出して利用できます。また、PDFファイルの中を検索してヒットした文字列の該当部分を反転表示することもできます。

具体的に説明します。

以下は本製品のユーザーマニュアルの一部ですが、通常の文字と画像が混在した構成になっています。

文字と画像が混在したPDF
文字と画像が混在したPDFの例
(画像をクリックすると拡大します)

このような場合、既にテキストがページ上にあるので(図では反転表示にしています)、このままで文字列を検索することが可能です。
しかし、画像部分にある文字も検索対象にしたいといったときはどうでしょう?
そのような場合、通常は、このページ全体を画像化してOCR処理でテキストを取り出します。

そうすると、画像部分の文字もテキスト化できますが、元からあるテキスト部分もOCR処理することになり、場合によっては誤認識で文字化けしてしまう可能性があります。
また、ページを画像化することで、このページにあるしおりの情報(図の左側に表示されているツリー上の見出し部分)も失われてしまいます。

『瞬簡PDF 変換 7』では、透明テキスト付きPDFの作成時に、[元の情報を保持してOCR結果を埋め込む]という機能を選択できます。

透明テキスト付きPDFのオプション

これは、PDFの元の情報を保持したまま、ページ内にある画像だけOCR処理をして、その結果を透明テキストとして一緒にPDFに埋め込み、保存するというものです。
先ほどのPDFをこの機能をオンにして、変換してみます。

透明テキスト付きPDF
画像部分に透明テキストを埋め込んだPDFの例
(画像をクリックすると拡大します)

図で、反転表示している箇所がテキストになります。画像上の文字に対してもテキスト化されているのがお分かりになると思います。
また、ページの左側にある、しおり情報がそのまま保持されている点にもご注目ください。

様々な情報をPDF化してパソコンに蓄積し、必要なときに取り出して参照する方法は、たいへん便利なものです。
それには、多数のPDFファイルから必要なものを探し出せるように、検索性の高いPDFを作成することが重要になってきます。
既存のPDFのテキストデータを生かし、さらに画像化された文字までテキストデータとして検索可能にするこの機能を、PDFご活用にお役立てください。

『瞬簡PDF 変換 7』の透明テキスト付きPDF作成機能について、詳細はOCRによる透明テキスト付きPDFの作成をご参照ください。
明日はPDFからExcelへの変換時の改善についてご説明します。


新発売『瞬簡PDF 変換 7』は、OCR処理を高速化!!

10月14日から販売開始した『瞬簡PDF 変換 7』では、OCR処理を見直し、画像化されたPDFから従来の製品より正確な文字認識処理を行うことができるようになりました。さらにOCR変換時の処理速度も大幅にアップしました。
下のグラフは、旧製品(リッチテキストPDF6.1)と『瞬簡PDF 変換 7』を使用して、画像データを既定の条件でWordへ変換した結果を比較したものです。

旧製品との速度比較
旧製品と『瞬簡PDF 変換 7』のOCR変換速度比較
(画像をクリックすると拡大します)

平均して、OCRを使用した変換では旧製品比で40~50% の速度アップを実現しています。この数値は、実行環境や元画像の状態、自動で回転や傾き補正を行うかどうかなどの条件によっても異なってきますが、多くの場合で処理速度の向上を実感していただけるものと思います。

また、操作画面においてもOCR処理がしやすくなる改善を行っております。

OCR変換条件の設定
(画像をクリックすると拡大します)

これまで、OCRを行う際の変換条件は、画面上に登録された複数のファイルに対して一括で適用されるようになっていましたが、今回これを見直して、ファイル個別に変換条件を指定できるようにしました。
手順としては、

  1. 最初にメニューバーから[ツール]→[OCR設定の既定値…]を選択します。これにより全体のOCR変換条件を指定できます。
    例えば、日本語文書を変換する機会が多い場合は、言語指定で[日本語]を選択して置きます。
  2. 次に登録されたファイル欄に表示された[OCR設定]ボタン(上図で赤枠内にあるオレンジ色のボタン)をクリックします。これによりファイル毎に異なるOCR変換条件を指定できます。
    例えば、選択したファイルが他と違い英文の文書であったなら、OCR変換条件で言語指定を[英語]に変更します。

このように指定を行ってから[実行ボタン]をクリックすると、ファイル毎に指定した条件により、OCRを利用した変換処理が一括で実行できます。

『瞬簡PDF 変換 7』について、詳細は製品紹介サイトをお訪ねください。
明日は透明テキスト付きPDF作成時の改善についてご説明します。


PDFをOfficeファイルに高精度変換!!  『瞬簡PDF 変換 7』 新発売

アンテナハウスでは、PDFをWordやExcelに変換して再編集可能にするソフト『瞬簡PDF 変換 7』を10月14日に販売開始しました。

先行してダウンロード版を発売し、パッケージ版は10月21日から出荷を開始していますので、このブログが掲載される頃には店頭で新しいパッケージを見ることができるかも知れません。

リッチテキストの名前が消えた!?

これまで弊社の『リッチテキストPDF』シリーズをお使いいただいていたユーザー様は、今回の製品名をみて「あれ!?」と思われたかも知れません。そうです、今回より製品名から『リッチテキスト』の文字が消えてしまいました。

『リッチテキストPDF』シリーズは2005年の6月に最初のバージョンを発売しまして、これまで何度も改良を重ねて参りました。PDFからOffice文書に変換するソフトウェアとしては、けっこう老舗の部類に入ると思います。
また、最初のバージョンは日経誌の記事”PDFをWordファイルに見事に変換「リッチテキストPDF」“にも取り上げられて、ここでお褒めをいただいたことや、ご指摘を受けたことなどが、以後の開発に随分と励みになったものです。

そのような、歴史?のある「リッチテキスト」の名称を今回使用しなかったのは、「瞬簡PDF」シリーズへの統合をより明確にするためでした。

『瞬簡PDF 変換』という命名には、ビジネスや日常で欠かせないものになってきたPDFの活用をサポートするツールとして、アンテナハウスがどのような製品を提供し、それで何ができるかを、分かりやすく明快にお客様にお伝えしたいとの思いを込めています。

「瞬簡」は、「瞬時」に「簡単」からなる造語です。「瞬簡PDF」という名称を共通に冠した弊社製品群が、この名に恥じないように、お客様のPDFご活用の一助となれば幸いに存じます。

今回の新製品では、今ご覧いただいているブログの右側を見ていただくとお分かりいただけますように、「瞬簡PDF 作成」と「瞬簡PDF 変換」のパッケージもこれまでと違って、幅の広い存在感のあるものにリニューアルしました。さらに、企業・官庁様向けに”超”お得な価格設定を新規に導入するなど、全体に力の入ったものとなっています。

さて、外側の話しはこれくらいにして、明日からは、内部でどのような改善を行ったかにつきまして、ご説明していきたいと思います。次回も是非お読みください。


Pages: Prev 1 2 3