カテゴリー別アーカイブ: 瞬簡PDF 変換

OCRを使いこなそう…(3)

前回 に続いて、PDF 変換ユーティリティ 『瞬簡PDF 変換 9』 の OCR 補正機能についてご説明します。

「OCR結果を補正…」を選択すると、OCR 補正機能で元の画像を表示します。

リボンメニューから「領域認識」ボタンをクリックしてください。
領域認識を実行

OCR 処理で画像をどのようなレイアウトで認識したかが分かりやすく表示されます。
赤枠で示された部分は横書きのテキスト領域、青枠で示された部分は画像領域、緑色で示された部分は表の領域を示しています。

問題の宛名部分は青枠で囲まれ、画像領域として認識されていたことが分かります。
これをテキスト領域に変更してやればよさそうです。

変更したい部分を選択して、リボンメニューから「文字横書き」ボタンをクリックします。
領域を変更

これで選択した箇所が赤枠で示されて横書きのテキスト領域に変更されます。
リボンメニューから「変換実行」ボタンをクリックしてみましょう。
変換を実行

変換が終了後、変換結果を Excel で表示すると宛名部分がテキストで変換されたことが確認できます。
補正された変換結果
OCR による誤認識を100%防止することは難しいものですが、OCR 補正機能を利用して作業の効率アップにつなげていただければ幸いです。

—————————
「瞬簡PDF 変換 9」は体験版をご用意しております。
これにより、変換精度や使い勝手を事前にご確認いただくことができます。

体験版では以下のような制限がありますので、あらかじめご了承ください。

  • インストールしてから 15日を過ぎると利用できなくなります。
  • ひとつの PDF について、3ページまで変換可能です。
  • 評価以外の目的で日常業務に利用することはできません。

体験版に関する詳細は、『瞬簡PDF 変換 9 体験版のお申し込み』 をご参照ください。

<< OCRを使いこなそう…(2)


OCRを使いこなそう…(2)

本日は、PDF 変換ユーティリティ 『瞬簡PDF 変換 9』 の OCR 補正機能についてご説明します。

以下のような画像を Excel に変換してみます。
サンプル画像

『瞬簡PDF 変換 9』 の既定値で変換すると以下のようになります。
既定値の変換結果

納品書の宛先部分が Excel で画像になってしまっています。
これは、本来テキストで認識してもらいたい部分ですが、OCR 処理では画像と誤認識してしまったようです。
Excel 上で元のテキストに編集し直すのは手間がかかります。

このような時、OCR 補正機能がお役にたちます。
元のファイル名を右クリックして表示されたメニューから「OCR結果を補正…」を選択してください。
OCR補正機能の呼び出し

—————————
「瞬簡PDF 変換 9」は体験版をご用意しております。
これにより、変換精度や使い勝手を事前にご確認いただくことができます。

体験版では以下のような制限がありますので、あらかじめご了承ください。

  • インストールしてから 15日を過ぎると利用できなくなります。
  • ひとつの PDF について、3ページまで変換可能です。
  • 評価以外の目的で日常業務に利用することはできません。

体験版に関する詳細は、『瞬簡PDF 変換 9 体験版のお申し込み』 をご参照ください。

<< OCRを使いこなそう…(1)      OCRを使いこなそう…(3) >>


OCRを使いこなそう…(1)

朝夕だいぶ冷え込むようになってきました。
弊社伊那支店の裏手には小さな川があって、その先はずっと田んぼが広がっています。
夏の頃には緑一色の中に真っ白なコサギが何羽も舞い降りてエサを探す様子が見えましたが、この頃は枯れ草色の田んぼに秋のやわらかな日が差し、遠くの山々の紅葉が秋の深まりを感じさせてくれるようになりました。

さて、皆さんは「OCR(オーシーアール)」というコトバをご存じでしょうか?

OCR は、Optical Caracter Recognition(光学的文字認識)の頭文字をとったもので、紙に印刷された文字をスキャナなどで読み取り、コンピュータで利用できる文字データに変換するソフトウェア技術です。

紙に印刷された情報はいったんスキャナなどでイメージデータに変換し、さらに OCR 処理をかけることで文字検索したり文書ソフトで編集するなど、再利用が可能なデジタル情報となります。
弊社の PDF 変換ユーティリティ 『瞬簡PDF 変換 9』 は OCR 処理を搭載して、スキャナで作成した PDF やイメージデータから Word や Excel への変換を実現しています。

ただし、OCR は100%の読取りを保証できるものではありません。
OCR はイメージデータの中から特徴的な点の集合を抽出して文字の形を認識しますが、元の画像に歪み、汚れ、滲み、かすれなどがあると正しい認識ができません。
また、イメージデータには文字だけでなく写真や線の情報なども含まれるので、それらを適確に判別できないと正しい認識ができません。

OCR で文字化けが発生する原因としては概ね以下のことが考えられます。

  1. 紙の原稿にかすれや汚れがある場合
  2. 文字の上に網掛けや線が重なったり、文字と文字の間隔が狭い場合
  3. スキャナで読み取る際に文字の解像度が低かったり、歪みがある場合
  4. 文字に傾きや装飾があったり、文字の字体が特殊である場合
  5. OCR 処理で文字領域、画像領域などのレイアウトを正しく判別できない場合

瞬簡PDF 変換 9』 の OCR 処理でも残念ながらの上記の1.~4.は対応が難しく、その場合は原稿の取り直しをしていただくか、変換結果を手作業で修正していただくことをお願いしております。
ただし、5.に関しては手作業ではありますが、変換前に誤認識を予防する手段として OCR 補正機能をご用意しています。
OCR補正機能

次回 は、この機能について詳しくご説明します。

—————————
「瞬簡PDF 変換 9」は体験版をご用意しております。
これにより、変換精度や使い勝手を事前にご確認いただくことができます。

体験版では以下のような制限がありますので、あらかじめご了承ください。

  • インストールしてから 15日を過ぎると利用できなくなります。
  • ひとつの PDF について、3ページまで変換可能です。
  • 評価以外の目的で日常業務に利用することはできません。

体験版に関する詳細は、『瞬簡PDF 変換 9 体験版のお申し込み』 をご参照ください。

OCRを使いこなそう…(2)>>


ユーザー登録と製品登録が大事というお話

製品の最新情報は電子メールで届きます

弊社のデスクトップ製品(PC用のソフトウエア)の最新情報は、主に製品のホームページへの掲載と、電子メールのメルマガ「アンテナハウス メールニュース」でお送りしています。メルマガはユーザー様が製品購入の際などにご登録いただいたメールアドレス宛にお送りしています。

最新情報とは

メールニュースでは次のような情報をお送りしています。

  • 改訂版(不具合改善、機能強化など) ⇒無償でダウンロードできます。
  • バージョンアップ ⇒対象のユーザー様は格安で次のバージョンをお求めいただけます。
  • セキュリティー情報 ⇒緊急対応などをお知らせいたします。
  • 展示会やセミナーのご案内 ⇒製品の使い方の相談や、セミナーで最新情報をゲットできます。
  • キャンペーンのご案内 ⇒時には半額以下の特売もあります。

ユーザー様の情報は、ユーザー様が直接弊社のWebページ「オンラインユーザー登録」で入力していただく必要があります。また、弊社のオンラインショップでご購入いただく際は、事前にユーザー情報をご登録いただく仕組みになっておりますので、前述の「オンラインユーザー登録」の入力作業は不要です。

それ以外のお店(家電量販店など実店舗やオンラインショップなど)でお求めいただいたユーザー様は、「オンラインユーザー登録」でユーザー登録をしていただくことで、初めて上記のメールニュースをお送りすることが可能になります。

もちろん、ユーザー登録の際に、メールニュース等の電子メールの送付の可否をお選びいただけます。送信不可を選ばれた場合、お得な情報はもちろん、製品のアップデート(更新)といった大切なメールを直接お届けすることができなくなります。なお、緊急対応が必要な場合や製品の終了といったユーザー様がお持ちの製品に直接かかわる事案につきましては、上記の可否に関わらずご案内をお送りすることがございます。あらかじめご承知おきください。

ユーザー登録だけでは不十分

ユーザー登録では、ユーザー様がお持ちの製品も登録することができます。この製品登録が実は大変重要です。メールニュースはお持ちの製品ごとにお送りしておりますので、ユーザー登録だけで製品登録がない場合は、必要な製品のメールニュースが届かない場合があるからです。

前述の「オンラインユーザー登録」からユーザー様が登録された製品の一覧を見たり、追加することができます。アンテナハウスの製品をお持ちのユーザー様で製品登録が正しくできているか、この機会にぜひご確認ください。

製品登録のメリット

製品登録をすると、下記のサービスを受けることができるようになります。

弊社のセールス部門には毎日多くのお問い合わせをいただきます。その中でも大きな割合をしめているのが、ユーザー登録・製品登録に関係する案件です。また、製品情報をメールで受け取っていれば、Webを定期的に見にいくような手間も省け、居ながらにして最新情報を入手することができます。アンテナハウスの製品をお持ちであれば、ユーザー登録と製品登録をぜひお薦めいたします。

※上記のご案内は、システム製品やOEM製品に関するユーザー登録ではございません。


「瞬簡PDF統合版」と「瞬簡PDF統合版官公庁向け」の違い

「瞬簡PDF統合版10」の発売は来週です!!

来る10月27日、お待たせしております「瞬簡PDF 統合版 10」(以下、通常版と表記)の販売を開始いたします。家電量販店の店頭販売やネットショップ、弊社のオンラインショップ等で一斉に販売されます。

瞬簡PDF 統合版 10」は、前バージョン「瞬簡PDF 統合版 9」と製品の構成は変わっていません。「瞬簡PDF 作成 7」を「瞬簡PDF 作成 8」へ、「瞬簡PDF 編集 6」を「瞬簡PDF 編集 7」へ、それぞれバージョンアップしています。特に新バージョン「瞬簡PDF 編集 7」は多くの機能追加や機能向上を実現した、今回一押しの製品です。

ところで、「瞬簡PDF 統合版 10」(通常版)に先んずること3か月も前の8月から、「瞬簡PDF 統合版 10 官公庁向け」という製品を先行販売しています。以下、官公庁向けと通常版の違いやご購入等について簡単にご紹介します。

「瞬簡PDF統合版10 官公庁向け」は2つの製品を追加

瞬簡PDF 統合版 10」(通常版)に対して、「瞬簡PDF to Image」と「瞬簡PDF サイン2」を追加した製品が「瞬簡PDF 統合版 10 官公庁向け」になります。

「瞬簡PDF to Image」は単体販売していますので、個別に追加購入することも可能ですが、「瞬簡PDF サイン2」は単独での販売は行っておりません。もし、PDFの電子署名付与や検証などが製品の要件としてあるようでしたら、「瞬簡PDF サイン2」を含む「瞬簡PDF 統合版 10 官公庁向け」をぜひご検討ください。

なお、「瞬簡PDF 統合版 10 官公庁向け」は製品名に「官公庁」と入っておりますが、ご利用を官公庁様のみに限定しているものではなく、民間の企業様、団体様も特に支障なくご利用いただける製品です。

瞬簡PDF 統合版 10 官公庁向け」の販売形態はサイトライセンス(10ライセンス以上)など企業・団体様向けライセンス販売のみで、単品でのお取り扱はございません。価格はデスクトップ製品のライセンスのページをご覧ください。


PDFをWordやExcelに変換したいけれど、どんな製品がいいのかよく分からない…(2)

PDFを再利用する場合、元となるPDFは内容によって以下の2種類に分けることができます。

1)テキストが含まれているPDF
2)テキストが含まれない画像だけのPDF

1)の「テキストが含まれているPDF」とは、WordやExcelなどで文字入力しPDF化したものが該当します。
このようなPDFからの変換には、『瞬簡PDF 変換 9』が適しています。

瞬簡PDF 変換 9』は、PDFにテキスト・データが含まれていればそれを解析してWordやExcelに変換します。テキスト・データをそのまま変換するため文字化けしたりすることなくWordやExcel形式に移して再利用可能になります。

変換されたいPDFにテキスト・データが含まれるかどうかは、Adobe Reader などでPDFを表示して[編集]メニューから[すべて選択]をクリックしてみてください。
テキスト・データが以下のように反転表示されれば、テキストが含まれるPDFだと判別できます(※)。

pdf

テキストをすべて選択

 

※ スキャナーで作成された画像には、スキャナーがOCR処理をかけてテキスト・データをPDFに埋め込むことがあります(透明テキストつきPDF)。この場合は同じようにテキスト部分が反転して表示されます。

2)の「テキストが含まれない画像だけのPDF」とは、紙の書類をスキャナーで読み取ってPDF化したものなどが該当します。
このようなPDFは文字と見える部分も画像でしかないため、そのままWordやExcel形式に変換しても編集のできない画像が貼り付きます。
このようなデータに対しては「OCR」といって画像から文字を認識する機能を使うことでテキスト・データを取り出すことができます。ただし、OCR処理では画像の状態により文字が正しく認識できず、文字化けしてしまうことがあるため注意が必要です。

紙に印刷された内容をWordやExcelで再利用されたい場合は、『瞬簡PDF OCR』が適しています。

瞬簡PDF OCR』はOCR専用製品で、スキャナーからの直接読み込みにも対応しています。
読み込んだ画像はOCR処理し、誤認識した文字を画面上で修正したり編集したりしながら、変換結果に反映させることができます。
(製品の仕様上、常にOCR処理をかけるため、テキスト・データがあらかじめ含まれているPDFを変換する用途には適しません。)

なお、『瞬簡PDF 変換 9』にもOCR機能があり、画像データからテキスト・データを認識して変換することができます。
ただし、スキャナーからの読み込み機能や誤認識した文字を画面上で修正する機能はありません。

瞬簡PDF OCR』は紙の書類の再利用をされたい場合に適しているのに対し、『瞬簡PDF 変換 9』は内容に関わらず複数のPDFを一括して変換されたいような場合に適していると言えます。

どういったPDFを再利用されたいかによって、いずれの製品を選択するかご検討いただければ幸いです。

PDFをWordやExcelに変換したいけれど、望み通りに変換してくれるか心配…

PDFをWordやExcelに変換したいとお考えの場合、どれだけ正確に変換できるかが気になることと思います。
上記2つの製品にはそれぞれ体験版をご用意しておりますので、その変換精度や使い勝手を事前にご確認いただくことができます。

ただし、体験版では以下のような制限がありますので、あらかじめご了承ください。

  • インストールしてから 15日を過ぎると利用できなくなります。
  • ひとつのPDFについて、3ページまで変換可能です。
  • 評価以外の目的で日常業務に利用することはできません。

体験版に関する詳細は、『瞬簡PDF 変換 9 体験版のお申し込み』、または『瞬簡PDF OCR 体験版のお申し込み』をそれぞれご参照ください。


PDFをWordやExcelに変換したいけれど、どんな製品がいいのかよく分からない…(1)

弊社伊那支店の近くには、春に桜で賑わう高遠という町があります。
江戸時代は高遠藩の城下町だったところで、そこかしこに古い時代の面影が残り普段はとても閑かな町です。
そこは、高遠石工と呼ばれる石工集団が活躍したところでもあり、城下の寺には名工といわれた守屋貞治が刻んだ数々の仏さまが遺されています。

正観世音菩薩

正観世音菩薩

写真が下手でうまく伝えられませんが、石なのに柔らかくて温かい表情が何ともいえず好きです。時間と興味のある方は、是非一度現地を訪ねてみてください。

閑話休題。

PDFは紙に代わるデジタルな文書形式として、すっかり身近なものになりました。もともとは閲覧や印刷用途で普及したPDFですが、WordやExcelのように自由に編集して再利用したいというニーズも必然的に増えています。

そのようなニーズに応えてご用意しているのが、弊社のパッケージ製品『瞬簡PDF 変換 9』と『瞬簡PDF OCR』です。

いずれも、PDFをWord(ワード)/Excel(エクセル)/PowerPoint(パワーポイント) の各文書形式に変換することでPDFの再利用が可能な製品です。

なぜPDFから変換をするのに2つも種類があるの? とは、よくお問い合わせをいただくご質問です。

次回は、2つの製品の違いを元になるPDFの観点からご説明します。


『瞬簡PDF 統合版 9』特別価格キャンペーン残りあとわずか

アンテナハウスオンラインショップでは『瞬簡PDF 統合版 9』特別価格キャンペーンを行っています。
大好評につき、7月20日17時まで期間延長していましたが、残りあと2日となってしまいました。

『瞬簡PDF 統合版 9』は作成・ページ編集・一括Office変換・OCR変換・記入の機能でPDFを最大限に活用できる『瞬簡PDFシリーズ』の 5 製品を同梱したお得なパッケージです!

決めかねている方、迷われている方も、ぜひ、この機会に『瞬簡PDFシリーズ』をご検討下さい。

キャンペーンのURLはこちらです。
https://web.antenna.co.jp/shop/html/products/list.php?category_id=321

「PDFって何」と思った方、まずは下記のページでPDFの基礎をささっと身につけましょう。
アンテナハウス PDF資料室


御礼14万ライセンス突破! お得なライセンス『AH-ULL』のサブスクリプション(短期利用契約)を開始します

東京は暑い日が続いています。梅雨はどこにいったのでしょうか。

さて、下記のグラフをご覧ください。
今年の新年のご挨拶でご紹介したグラフですが、これがもうすぐ14万を超えます。勢いは加速しているようです。

ahull_graph

2011年にスタートした「AH-ULL」は、企業・自治体・官公庁・団体など、同じソフトウェアを複数のPCで使用されるような環境に向けた“超お買い得な”ライセンスです。
AH-ULL」であれば、机上でご利用中のメインPCと、携帯用のサブPCの複数台でご利用される場合も、お一人の利用とカウントすることができます。

この春から「AH-ULL」ライセンスのサブスクリプション方式(1年単位の短期利用契約)を開始しました。詳しくは正規販売代理店の東京インタープレイ株式会社(東京都千代田区)へお問い合わせください。

AH-ULL」はアンテナハウスの「瞬簡PDF」シリーズが対象です。
AH-ULL」の詳細は下記をご覧ください。
https://www.antenna.co.jp/purchase/ahull.html


PDF を Word や Excel に変換!PDF 変換機能をアプリケーションに簡単に組み込むライブラリのご紹介(1)

弊社のパッケージ製品 『瞬簡PDF 変換 9』 は、PDF を Microsoft Office Word、Excel、PowerPoint の各文書形式に変換することで PDF の再利用を可能とし、たいへんご好評をいただいております。

この変換機能をソフトウェアベンダー様が自社のアプリケーションに組み込んで利用できるライブラリとして提供するのが、『Antenna House PDF to Office 変換ライブラリ Ver.1.2.0』(以下、本ライブラリ)です。

本ライブラリで提供する機能は、PDF ファイル(Ver.1.3 – Ver.1.7)を入力して、Microsoft Word(doc/docx)、Excel(xls/xlsx)、PowerPoint(ppt/pptx)の各形式で別ファイルに保存するものです。

 

PDF to Office 処理概要

これまで、多くのソフトウェアベンダー様からご評価をいただき、PDF で配布されている積算資料や帳票類をExcelに変換するなど、主に土木・会計システムでご採用をいただいております。

本ライブラリに関する詳細は、『Antenna House PDF to Office 変換ライブラリ』 をご参照ください。
本ライブラリの価格・ライセンス条件等、詳しくは、oem@antenna.co.jp までお問い合わせください。

 ご紹介(2) >>


Pages: Prev 1 2 3 4 5 6 Next