AH Formatter V6.0 改訂5版リリース!

2012年10月23日、AH Formatter V6.0 改訂5版を公開しました。
メンテナンスリリースのため基本は障害修正のみですが、
一点だけ次の機能強化をしました。
・mathcolor に rgb-icc の指定を可能にした。
ご報告いただいた障害に対しての修正につきましては、
改訂情報のページをご覧ください。
AH Formatter V6.0 改訂情報
評価版は以下のページよりお申し込みいただけます。
AH Formatter V6 評価版のお申し込み
製品のご購入につきましては、事前に技術相談会を行っております。お気軽にお問い合わせください。
アンテナハウス システム製品技術相談会




アウトライナー
PDFを解析して しおり・目次を自動生成


HTML on Word
WebページをWordで作る!

「行先番2」サービスパック5.2を公開

「行先番2」サービスパック5.2を公開しました。
本サービスパックは行先番をご利用されている方を対象に配布するものです。
行先番サーバがインストールされているPCに本サービスパックを上書きインストールしていただくことで、プログラムが最新版に更新されます。
クライアント側はサーバの更新に伴い自動アップデートされますのでとくに何もする必要はありません。
ただまれに自動アップデートに失敗する場合があります。その場合はクライアントもダウンロードしてインストールをおこなってください。
※現在のバージョンを確認するには行先番クライアントを起動してメニューから[ツール]-[オプション]を選択、オプションダイアログが表示されたら、[サーバ]タブをクリック、サーバ一覧から該当のサーバを選択して「接続テスト」ボタンを押してください。
バージョンが2.20.02以前の場合、このサービスパックを適用してください。
●改訂内容
5.2
・検索に失敗したときに表示されるダイアログが検索ダイアログの後ろに入って選択できないことがある問題を修正しました。
・プロパティのデータ編集画面で登録ユーザ欄にユーザ名が表示されないようにしました。
5.1
・検索できたにも関わらずエラーが表示されることがある問題を修正しました。
・同一データの編集ウィンドウを複数ださないようにしました。
・Administratorのパスワード変更ができない問題を修正しました。
 
サービスパックのダウンロードおよび導入方法はこちらからどうぞ。




瞬簡PDF 編集 2024
かんたん操作でPDFを自由自在に編集


瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品!

Formatter Club 定例会「文字組版の最先端」開催のお知らせ

10月22日(月)に Formatter Club 定例会「文字組版の最先端」を開催します。
今回の定例会では、「文字組版の最先端」と題してインドの文字組版、縦書きのマークアップ方法のご説明、更に次期バージョンの『AH Formatter V6.1』と現在開発中の電子文書のビューア『AH Reader』のプレビューを行います。同時に、『AH Formatter V6.1』と『AH Reader』のモニターも募集いたします。
今回の定例会は、会員以外の方でもご参加いただけるオープンなセミナーですので、ご興味をお持ちの方は是非ご参加ください。
◇ お問い合わせ先:
・アンテナハウス株式会社 Formatter Club 事務局
・電話:03-5829-9021
・mail:sis@antenna.co.jp
今回の定例会の詳細及び申し込みは次のページをご覧ください。
定例会概要
Formatter Club の詳細については次のページをご覧ください。
Formatter Club について




瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識


アウトライナー
PDFを解析して しおり・目次を自動生成

Server Based Converter V4.0 MR2について その2

 Server Based Converterは、Microsoft Office, PDFなどのファイルを、PDF, Flash, SVG, 各種画像形式にダイレクトに変換する変換エンジンです。
 ダイレクト変換の意味は、たとえば、Microsoft Officeがない環境でも、ファイルさえあれば、それをダイレクトに内容を見える形式に変換できるのです。
 前回のブログ担当日から今日までの間に、改訂版として、V4.0 MR2を出荷しましたので、それを紹介します。
 昨日は、APIの変更について、ご案内させていただきましたが、本日は、他の改訂内容から。
 Wordのバグ修正が一番多いです。
 その中でも、シェイプのレイアウトに関するものが多く、今回の改訂で、以前よりシェプ関係のレイアウト再現性は、多少なりとも向上していると考えています。シェイプ以外にも、細かな修正があれこれあります。
 Word以外でも、Excel, PowerPoint, SVGに関して、改訂が行われています。
 総合的には、以前より、レイアウト再現性は、向上していると考えています。
 Server Based Converter V4.0 MR2の改訂内容については、

サーバベース・コンバーター V4.0 (Ver.4.0.MR2)

をご覧ください。
 今回の改訂は、細かなものが多く、多岐にわたりますが、大筋は、レイアウト再現性の向上を目指したものです。早目に、改訂版の導入をお願いします。
 Server Based Converterに関する詳しい情報は、
Server Based Converter 製品ページ
を、ぜひ、ご覧ください。
 評価版もご用意しております。
サーバベース・コンバーター 評価版のお申し込み
から、お申し込みください。
 アンテナハウスのシステム製品につきましては、事前に技術相談会を行っております。お気軽にお問い合わせください。
 詳しくは、
アンテナハウス システム製品技術相談会
をご覧の上、お申し込みください。




HTML on Word
WebページをWordで作る!


瞬簡PDF 変換 2024
PDFをOffice文書へ高精度変換

Server Based Converter V4.0 MR2について

 Server Based Converterは、Microsoft Office, PDFなどのファイルを、PDF, Flash, SVG, 各種画像形式にダイレクトに変換する変換エンジンです。
 ダイレクト変換の意味は、たとえば、Microsoft Officeがない環境でも、ファイルさえあれば、それをダイレクトに内容を見える形式に変換できるのです。
 前回のブログ担当日から今日までの間に、改訂版として、V4.0 MR2を出荷しましたので、それを紹介します。
 今回の改訂で、もしかしたら、お客様にお手数をおかけしてしまうかもしれないのが、APIの変更です。
 PageNumberCorrectionのAPIを、
 C/C++インターフェースについては、いろいろな事情があり、変更はしませんでしたが、Javaインターフェース, .NETインターフェース, COMインターフェースについては、引数と戻り値の型を変更しました。
 これは、うっかりミスといえるもので、大変恥ずかしいものです。
 通常、APIの変更はMRでは行いませんが、まだ、このAPIをお使いになっているお客様は少ないだろうと判断し、変更に踏み切りました。
 もし、このAPIをお使いのお客様で、V4.0 MR2に移行するお客様は、大変申し訳ございませんが、このAPIを使っているプログラムを再ビルドしてください。
 今後、こういうことがないように、十分、気をつけて開発を進めます。
 何卒、ご了承ください。
 Server Based Converter V4.0 MR2の改訂内容については、

サーバベース・コンバーター V4.0 (Ver.4.0.MR2)

をご覧ください。
 今回の改訂は、細かなものが多く、多岐にわたりますが、大筋は、レイアウト再現性の向上を目指したものです。早目に、改訂版の導入をお願いします。
 Server Based Converterに関する詳しい情報は、
Server Based Converter 製品ページ
を、ぜひ、ご覧ください。
 評価版もご用意しております。
サーバベース・コンバーター 評価版のお申し込み
から、お申し込みください。
 アンテナハウスのシステム製品につきましては、事前に技術相談会を行っております。お気軽にお問い合わせください。
 詳しくは、
アンテナハウス システム製品技術相談会
をご覧の上、お申し込みください。




瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品!


瞬簡PDF 編集 2024
かんたん操作でPDFを自由自在に編集

TextPorterのWindows Server 2012対応について

 TextPorterは、サーバ組込用のテキスト抽出エンジンで、Word, Excel, PDFなど色々なアプリケーションのファイルから文字列を抜き出します。
 TextPorterは、Windows Server 2012に対応するかというお問い合わせを頂戴しています。
 TextPorterは、Windows Server 2012に対応いたします。
 現在、動作検証を進めている状況です。
 現在の最新版は、V5.2 MR2ですが、これで動作確認を行います。動作に問題がなければ、その旨、ウェブなどでお知らせいたします。
 もし、動作に問題が起きたときは、改良を加えて、V5.2 MR3としてリリースすることになります。
 いずれにしましても、最新バージョンの最新MRで、Windows Server 2012に対応することになります。
 それ以前のバージョンにつきましては、まことに勝手ながら動作保証の対象外とさせていただきたく存じます。
 どうしてもという場合は、弊社にお問い合わせいただければ、善後策を協議することができると考えております。
 よろしくお願いいたします。
 TextPorterについての詳しい説明は、
TextPorter
をご覧ください。
 評価版もご用意しております。
TextPorter 評価版のお申し込み
から、お申し込みください。
 アンテナハウスのシステム製品につきましては、事前に技術相談会を行っております。お気軽にお問い合わせください。
 詳しくは、
アンテナハウス システム製品技術相談会
をご覧の上、お申し込みください。




アウトライナー
PDFを解析して しおり・目次を自動生成


HTML on Word
WebページをWordで作る!

Server Based ConverterのWindows Server 2012対応について

 Server Based Converterは、Microsoft Office, PDFなどのファイルを、PDF, Flash, SVG, 各種画像形式にダイレクトに変換する変換エンジンです。
 ダイレクト変換の意味は、たとえば、Microsoft Officeがない環境でも、ファイルさえあれば、それをダイレクトに内容を見える形式に変換できるのです。
 Server Based Converterは、Windows Server 2012に対応するかというお問い合わせを頂戴しています。
 Server Based Converterは、Windows Server 2012に対応いたします。
 現在、動作検証を進めている状況です。
 現在の最新版は、V4.0 MR2ですが、これで動作確認を行います。動作に問題がなければ、その旨、ウェブなどでお知らせいたします。
 もし、動作に問題が起きたときは、改良を加えて、V4.0 MR3としてリリースすることになります。
 いずれにしましても、最新バージョンの最新MRで、Windows Server 2012に対応することになります。
 それ以前のバージョンにつきましては、まことに勝手ながら動作保証の対象外とさせていただきたく存じます。
 どうしてもという場合は、弊社にお問い合わせ下されば、善後策を協議することができると考えております。
 よろしくお願いいたします。
 Server Based Converterに関する詳しい情報は、
Server Based Converter 製品ページ
を、ぜひ、ご覧ください。
 評価版もご用意しております。
サーバベース・コンバーター 評価版のお申し込み
から、お申し込みください。
 アンテナハウスのシステム製品につきましては、事前に技術相談会を行っております。お気軽にお問い合わせください。
 詳しくは、
アンテナハウス システム製品技術相談会
をご覧の上、お申し込みください。




瞬簡PDF 作成 2024
ドラッグ&ドロップでPDF作成


アウトライナー
PDFを解析して しおり・目次を自動生成

『瞬簡PDF OCR』を使ってみましょう(その3)

本日は、日本語/英語活字OCR変換ソフト『瞬簡PDF OCR』のご紹介の最終回です。

昨日は、『瞬簡PDF OCR』で領域の誤認識を直す方法について説明をしました。

本日は、文字の誤変換を回避する方法として、画像データの「文字認識」について説明します。
これまでの変換例では、文書の先頭のタイトル部分が文字を誤認識しておかしな結果になっていました。

sample_result4.png

元の文字を見ると、丸文字系のフォントが使われていてデザインを優先した文字であることが分かります。
実は、こういった文字の認識はOCR処理の苦手とする部分です。人間の眼でみればなんということもないのですが、画像化された点の集まりから文字の形を拾い出して元の文字コードを推測するというOCR処理の論理からすると、文字の形状や方向が変化している画像は元の文字を特定しにくくて誤変換しやすいものとなるのです。
OCRソフトを使った変換では、こうした誤変換を変換前に修正する機能を用意しています。

再び『瞬簡PDF OCR』に戻って、ツールバーにある「文字認識」というボタンをクリックします。OCR処理で文字認識した結果が右のテキストビューに表示されますので、誤変換している文字を選択します。
すると、いくつか文字の一覧が傍らにポップアップで表示されるので、そこに正しい文字があれば選択して置き換えます。

char_modify.png

同様に他の文字についても置き換えを行っていきます。

また、『瞬簡PDF OCR』では、テキストのフォント種類やサイズ、色、強調表示なども合わせて指定できます。
変換したいテキスト範囲を選択して、「文字のプロパティ」で文字属性を簡単に変更することが可能です。

<char_modify2_s.png
(画像をクリックすると拡大します)

このように文字の認識結果について気になるところがあれば、変換前にある程度修正を行うことが可能です。

さて、以上の修正を行った上であらためてWordに変換した結果を示します。左側の既定値での変換結果と比較してみてください。

sample_result5_s.png
(画像をクリックすると拡大します)

一度紙に固定された文書からテキストや画像を取り出し再利用可能にするOCRソフトは、非常に有用なツールです。
オフィスや家庭には、これまであまり再利用されなかった紙の資産がたくさん眠っているのではないでしょうか?
『瞬簡PDF OCR』をご活用いただくことで、皆さまの資産の有効利用に多少なりともお役に立つことができれば、開発・販売を行っているものとして、たいへん嬉しく存じます。
今後とも弊社製品をご愛用いただけますよう、よろしくお願いいたします。

※『瞬簡PDF OCR』は製品の体験版を公開しております。『瞬簡PDF OCR』のユーザー体験を、製品紹介サイトでお試しください。




HTML on Word
WebページをWordで作る!


アウトライナー
PDFを解析して しおり・目次を自動生成

『瞬簡PDF OCR』を使ってみましょう(その2)

日本語/英語活字OCR変換ソフト『瞬簡PDF OCR』を使った変換について、昨日の続きから説明します。

『瞬簡PDF OCR』は、以下の手順で画像からの変換処理を行います。

  1. 画像データの読み込み
  2. 領域解析
  3. 文字認識
  4. 変換先ファイル形式への保存

昨日は、OCRソフトでは誤変換が避けられないというお話をしました。

本日は、誤変換を回避する方法として、画像データの「領域解析」から説明していきます。
下記は、サンプルのPDFを既定値で変換した例です。

sample_result_s.png
(画像をクリックすると拡大します)

自慢にならないですが、ひと目みて、おかしな変換や文字の誤変換があることがお分かりになるかと思います。
特に赤い丸をつけたグラフ部分がまったく再現されていません。これは、Word上では表に変換されているためです。
この原因は、OCR処理でこの部分の領域を間違えて認識しているためです。

『瞬簡PDF OCR』に戻って、ツールバーにある「領域解析」というボタンをクリックすると、OCR処理でどのような認識が行われたかが分かります。
以下は、問題部分の領域解析結果です。

sample_result2.png

図で、赤枠で囲まれた箇所は横書きテキスト、ピンク色の枠で囲まれた箇所は縦書きテキスト、緑色の枠で囲まれた箇所は表領域にそれぞれ認識されています。表と認識されたのは、グラフにある横の目盛りを表の罫線と認識したためです。
これでは、Word上で修正しようがないので、元の認識処理に遡ってやり直す必要があります。

誤認識した範囲を画像領域に変更する例を図で示します。
(1)誤認識している領域範囲をマウスでドラッグ→(2)選択された領域をすべて解除→(3)範囲を選択し直し、一括で画像領域に変更

change_layout_s.png
(画像をクリックすると拡大します)

領域を変更したところで、いったんWordに変換して結果を確認してみましょう。いったん「文字認識」を行い、「Wordへ変換」ボタンをクリックします。
以下は、Wordに変換しなおした結果です。先ほどのグラフ部分に注目してください。

sample_result3_s.png
(画像をクリックすると拡大します)

さて、変換結果をみると、まだ不具合があります。文書の先頭のタイトル部分が文字を誤認識しておかしなことになっています。

sample_result4.png

誤認識した文字の修正方法は、また明日の回で説明しましょう。

※『瞬簡PDF OCR』は製品の体験版を公開しております。『瞬簡PDF OCR』のユーザー体験を、製品紹介サイトでお試しください。




瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品!


瞬簡PDF 編集 2024
かんたん操作でPDFを自由自在に編集

『瞬簡PDF OCR』を使ってみましょう(その1)

日本語/英語活字OCR変換ソフト『瞬簡PDF OCR』を使って変換するまでの概略を何回かに分けてご紹介します。

『瞬簡PDF OCR』は、以下の手順で画像からの変換処理を行います。

  1. 画像データの読み込み
  2. 領域解析
  3. 文字認識
  4. 変換先ファイル形式への保存

これまでOCRソフト製品を使用してこられた方であれば、お馴染みの手順かと思います。

それでは、まず画像データの読み込みから始めましょう。

  • イメージスキャナ:イメージスキャナは一般的にTWAINと呼ばれる標準規格を採用しています。『瞬簡PDF OCR』もこの規格を採用したスキャナであれば基本的に扱うことができます。
    また、TWAIN規格ではないですが、「ScanSnap」というドキュメントスキャナの機種で読み込んだデータも受け取ることができます。
  • PDF:PDFには、スキャナで作成される画像だけのPDFもありますし、一般的にPDFドライバと呼ばれる仮想プリンタ形式のソフトを使って、Wordなどのアプリケーションから作成されるテキストが含まれたPDFもあります。
    『瞬簡PDF OCR』はいずれのPDFであっても読み込みできます。ただし、後者のテキストが含まれたPDFはいったん画像にした上でOCR処理しますので、元あったテキストデータは消えてしまいます。この点はご注意ください。
  • 画像ファイル:イメージファイルとして一般的なビットマップ形式や写真でよく使われるJPEG形式など、広く使用されている画像形式をサポートしています。また、クリップボードにコピーした画像データも対象にできます。

ここでは、手近にあるPDFを読み込む手順を説明しましょう。ファイルの読み込みは、単にWindowsのエクスプローラなどから任意のPDFをつかんで、『瞬簡PDF OCR』の上にドラッグ&ドロップするだけです。
この際に、既に何か読み込みされたデータがあると、以下のような確認画面が表示されるのが他のOCRソフトと違ったところです。

ドキュメントに追加しますか?

これが昨日説明した、『瞬簡PDF OCR』独特のドキュメントの扱い方に関連するものです。既にあるドキュメントに同じ仲間としてページを追加するか、あるいは別物として新規にドキュメントを作成し、そちらに格納するかを問い合わせているわけです。
ここでもし「追加する」を選択し、画面中にある「以後、同じ処理を繰り返す」にチェックをいれると、次に新しいデータを取り込んでも問い合わせをしないで、ひとつのドキュメントに「追加」し続けます。この指定は、1枚づつしか取り込みできないスキャナから連続して原稿を取り込みたいときなどに便利です。

画像の読み込みが終わると、内容が画面に表示されます。
下記は、PDFを読み込んだ直後の状態です。

PDFを読み込んだ例
(画像をクリックすると拡大します)

結果を急ぐ人は、ここでいきなり変換してしまうこともできます。

変換の開始

元の画像の条件がよい場合は、いきなり変換してそのまま再利用ができるほどの変換結果が得られるかも知れません。
OCR処理で「条件がよい」というのは、元の画像の解像度が高くて、画像の傾き、ゴミなどのノイズがなく、文字は活字で余分な飾りもなく、レイアウト自体も単純、といったような場合をさします。しかし、そういった原稿など現実にはあまりなさそうですね。
通常、OCR処理で変換したい画像は、たいてい文字が化けたり元と違う文字に置き換わったりするなど、誤変換が避けて通れないものです。

元と違う文字が変換される程度であれば、変換後にワープロソフトを使って修正可能ですが、画像で変換したい箇所を文字と誤認識してひどい文字化けになるなど、変換後では修正しきれない場合もあります。
このような事情から、OCRソフトには誤変換を回避するための処理が備わっています。
その詳細は、明日の回で説明することにしましょう。

※『瞬簡PDF OCR』は製品の体験版を公開しております。『瞬簡PDF OCR』のユーザー体験を、製品紹介サイトでお試しください。




瞬簡PDF 変換 2024
PDFをOffice文書へ高精度変換


HTML on Word
WebページをWordで作る!
Pages: Prev 1 2 3 ... 158 159 160 161 162 163 164 ... 232 233 234 Next