Office Server Document Converter の活用法(3)

■ TextPorter と組み合わせた文書管理システム

企業や組織においては、毎日、膨大な数の文書が、Microsoft Office で作られています。それを紙に印刷していたのでは、保管も閲覧も大変です。
そこで、これらの文書を電子文書のままファイリングし、管理する文書管理システムが作られています。
ここで、Office Server Document Converter と、弊社のサーバ製品の1つである TextPorter が活躍しています。TextPorter は、Microsoft Office 文書や PDF から、テキストを抽出する製品です。

システムのイメージは、
Office Server Document Converter 活用例
にある
サムネイルサーバ
を発展させたものと思っていただけるといいです。

Office Server Document Converter によって、文書からサムネイルを生成することで、ファイル名だけではわかりにくい文書の見分けも簡単にできるようになります。
そして、TextPorter で文書からテキストを抽出して、全文検索システムで検索できるようにしておくことで、目的の文書をすばやく探し出して、そのサムネイルをみて、実際の文書を引っ張り出せるようにするわけです。

TextPorter に関する詳しい情報は、
http://www.antenna.co.jp/axx/
を、ぜひ、ご覧ください。

〒103-0004
東京都中央区東日本橋2-1-6 東日本橋藤和ビル5F
アンテナハウス株式会社
◆ご購入に関するお問い合わせ(祝日を除く月~金曜日9:30~18:00)
TEL : 03-5829-9021
FAX : 03-5829-9023
E-mail: sis@antenna.co.jp
URL : http://www.antenna.co.jp/

Office Server Document Converter は、Microsoft Office, PDF などのファイルを、PDF, Flash, SVG, 各種画像形式にダイレクトに変換する変換エンジンです。 ダイレクト変換の意味は、たとえば、Microsoft Office がない環境でも、ファイルさえあれば、それをダイレクトに内容を見える形式に変換できるのです。ダイレクト変換には、Microsoft Office のライセンスも不要です。
Office Server Document Converter は、ダイレクト変換というユニークさが評価され、多くのウェブサービス、パブリッククラウド、プライベートクラウドなどで利用されています。

Office Server Document Converter に関する詳しい情報は、
Office Server Document Converter
を、ぜひ、ご覧ください。

評価版もご用意しております。
Office Server Document Converter 評価版のお申し込み
から、お申し込みください。

<< Office Server Document Converter の活用法(2)


Office Server Document Converter の活用法(2)

■ PDF生成サーバ

普段使用している Microsoft Office ファイルをファイルサーバへ Upload し、後は、Office Server Document Converter で PDF ファイルを作成できます。
作成する PDF ファイルには「印刷不可」等のセキュリティ設定も付けることができるので、利用目的に合わせた PDF ファイルを随時作成可能になります。

Office Server Document Converter:PDF生成サーバ

更に。。。

PDFToolAPI を使用することにより、「しおり」の作成や、ファイルの分割・統合も可能です。さらに、Web 経由にて PDF ファイルを表示する際には、スマホや携帯電話などの利用環境がシビアな場合にも対応できるように「リニアライズ PDF」も作成できます。

* PDFToolAPI の機能は上記の他に「指定ページ抽出」や「文書情報設定・取得機能」「すかし」「墨消し」等があります。 詳しくは、PDFToolAPI を参照してください。

Textporter で検索 Index 用のテキストデータを抽出し元ファイルと関連付けすることにより全文検索の対象とすることも可能です。

* Textporter の機能は上記の他に「ファイル識別」「プロパティ抽出」「文字コード変換」等があります。 詳しくは、 Textporter を参照してください。

〒103-0004
東京都中央区東日本橋2-1-6 東日本橋藤和ビル5F
アンテナハウス株式会社
◆ご購入に関するお問い合わせ(祝日を除く月~金曜日9:30~18:00)
TEL : 03-5829-9021
FAX : 03-5829-9023
E-mail: sis@antenna.co.jp
URL : http://www.antenna.co.jp/

Office Server Document Converter は、Microsoft Office, PDF などのファイルを、PDF, Flash, SVG, 各種画像形式にダイレクトに変換する変換エンジンです。 ダイレクト変換の意味は、たとえば、Microsoft Office がない環境でも、ファイルさえあれば、それをダイレクトに内容を見える形式に変換できるのです。ダイレクト変換には、Microsoft Office のライセンスも不要です。
Office Server Document Converter は、ダイレクト変換というユニークさが評価され、多くのウェブサービス、パブリッククラウド、プライベートクラウドなどで利用されています。

Office Server Document Converter に関する詳しい情報は、
Office Server Document Converter
を、ぜひ、ご覧ください。

評価版もご用意しております。
Office Server Document Converter 評価版のお申し込み
から、お申し込みください。

<< Office Server Document Converter の活用法(1)


「Antenna House PDFXML 変換ライブラリ V2.0」メンテナンスリリースについて

2017年11月22日に、Antenna House PDFXML 変換ライブラリ V2.0 MR1 をリリースしました。

V2.0R1a と V2.0MR1 の相違点

  • 縦書き/横書き混在の CID フォントを使用している場合に、縦書き用記号から縦書きページを判断する処理を追加しました。
  • 縦線の結合処理において、余分な結合が発生する場合が有りましたので、調整しました。
  • 縦書きページに存在する横書きの数字をページ番号と判断する処理を修正しました。
  • セルの縦横結合の解析処理を改善しました。
  • セルのデータが一部出力されない不具合を修正しました。
  • 文字データが一部消えてしまう不具合に対応しました。
  • 画像ファイルの出力オプションに EMF を追加しました。
  • Antenna House PDFXML の仕様を修正しました。
Element/Attributes/Types 名前 区分 説明
Element ahp:font 追加 アトリビュート”rotation”を追加しました。
Element ahp:style 追加 アトリビュート”line-distance”を追加しました。

「Antenna House PDFXML 変換ライブラリ V2.0」は、PDF ファイルの内部データを、XML(Extensible Markup Language:拡張可能なマークアップ言語)形式に変換するプログラムです。 このライブラリが出力する XML 形式を「Antenna House PDFXML形式」と呼びます。
PDF 解析技術により文書構造を生成して、再利用に適した XML データを出力します。 XML で表現することによって、データの扱いが容易になります。
XML のメリットを最大限に活かして PDF データを活用できます。
弊社ウエブサイトより評価版の申し込みが可能です。是非ご評価ください。

製品に関するご質問は
sis@antenna.co.jp
または
oem@antenna.co.jp(OEM担当)
まで、お気軽にお問い合わせください。

評価版のお申込
評価版のお申込ページ

Webページ
http://www.antenna.co.jp/pdfxml/


Office Server Document Converter の活用法(1)

■ ファイルの無害化

Office Server Document Converter は、Microsoft Office 文書の変換においてマクロを実行しません。
したがって、マクロ内に不正なコードが合った場合にもその実行は行われずにPDFや画像、SVG, Flash といった形式のファイルを生成できます。
PDF に関しても Script を実行することはないので画像や SVG, Flash といった形式のファイルを生成できます。また、PDF から PDF への変換も可能です。
企業ユーザ様、特にグローバル企業では、様々なファイルを日々受け取っていることと思われます。そのような場合でもよりセキュアな状態でファイルを取り扱うことが可能となります。
また、官公庁や学校等で使用するファイルに関しても、Office Server Document Converter でいろいろな形式に変換することにより、より確実に無害化されたファイルを取り扱えるようになります。

Office Server Document Converter:PDF生成サーバ

〒103-0004
東京都中央区東日本橋2-1-6 東日本橋藤和ビル5F
アンテナハウス株式会社
◆ご購入に関するお問い合わせ(祝日を除く月~金曜日9:30~18:00)
TEL : 03-5829-9021
FAX : 03-5829-9023
E-mail: sis@antenna.co.jp
URL : http://www.antenna.co.jp/

Office Server Document Converter は、Microsoft Office, PDF などのファイルを、PDF, Flash, SVG, 各種画像形式にダイレクトに変換する変換エンジンです。 ダイレクト変換の意味は、たとえば、Microsoft Office がない環境でも、ファイルさえあれば、それをダイレクトに内容を見える形式に変換できるのです。ダイレクト変換には、Microsoft Office のライセンスも不要です。
Office Server Document Converter は、ダイレクト変換というユニークさが評価され、多くのウェブサービス、パブリッククラウド、プライベートクラウドなどで利用されています。

Office Server Document Converter に関する詳しい情報は、
Office Server Document Converter
を、ぜひ、ご覧ください。

評価版もご用意しております。
Office Server Document Converter 評価版のお申し込み
から、お申し込みください。

Office Server Document Converter の活用法(2)>>


SBC と OSDCの 相違点

Server Based Converter V6.0 と Office Server Document Converter V6.1 の機能的な差はありません。Server Based Converter V6.0 MR4 と Office Server Document Converter V6.1 MR1 は、ほぼ同じ Source で作成されております。その関係は、今後も販売終了まで継続されます。

Server Based Converter V6.0 と Office Server Document Converter V6.1 の違いは、

1) 製品名称
2) 一部モジュールの名称変更
3) 製品カテゴリの追加
4) Flash 出力版の廃止
5) Web Interface の追加

となります。

【一部モジュールの名称変更】
弊社別製品にて使用している同一名称のライブラリのバージョンが異なる場合があるため、問題が発生する場合がありました。この問題を解消するため Server Based Converter で使用している以下の名称を変更いたします。

対象ライブラリ

・ Windows 版

<変更前>
AHFontService14.dll
AHGraphicService11.dll
AHDMC13.dll
AHCommon13.dll
AHPDFLib12.dll

<変更後>
DfvAHFontService14.dll
DfvAHGraphicService11.dll
DfvAHDMC13.dll
DfvAHCommon13.dll
DfvAHPDFLib12.dll

・ Linux 版

<変更前>
libAHGraphicService.so
libGL.so
libOSMesa.so
libGLU.so
libAHDMC.so
libAHCommon.so
libAHPDFLib.so
libAHFontService.so.1.4
libPdfiumModule.so
<変更後>
libDfvAHGraphicService.so
libDfvGL.so
libDfvOSMesa.so
libDfvGLU.so
libDfvAHDMC.so
libDfvAHCommon.so
libDfvAHPDFLib.so
libDfvAHFontService.so.1.4
libDfvPdfiumModule.so

*法則としては、Windows 版は、【Dfv】+【旧名称】となり、Linux版は【lib】+【Dfv】+【旧名称】となります。

【製品カテゴリの追加】
製品カテゴリを一部変更し、Microsoft Word/Excel/PowerPoint の各読込に限定(一部例外あり)した「Select 」版を設けます。
価格などは、こちら をご確認ください。

【Flash 出力版の廃止】
Flash 出力版の販売終了しました。Flash 出力が必要な場合は、Professional 版をご購入ください。

なお、個別契約となる OEM(組込み)契約や ASP/SaaS 契約の場合は、そのご契約内容毎にこれからも販売していきます。

【開発環境の変更】
OSDC は、以下の開発環境で作成されています。

・ Windows 版

<C/C++>
Microsoft Visual C++ 2015 でビルドされています。SampleGUI を除き、MFC は使われていません。 呼び出し側のプログラムは、互換性のあるコンパイラをご使用ください。

<.NET Framework 4.0/4.5.x/4.6 (DfvDotNet40Ctl60.dll) VisualStudio 2010>
VisualStudio 2012
VisualStudio 2013
VisualStudio 2015

<JAVA>
Java SE 8

・ Linux 版

<C/C++>
gcc 4.8

<JAVA>
Java SE 8

*動作には、libc.so.6(glibc-2.17), libstdc++.so.6 で、これらとバイナリ互換性があるライブラリが必要です。
*Linux 版に関しては、Distribution を指定しての動作保証はしておりませんが、OSDC に必要な開発環境の入手が難しい場合は、CentOS7 以降を推奨いたします。

【Web Interface for OSDC】
インターネットでプログラムレスの変換を実現できる 『Web Interface for OSDC』 を同時に販売しまた。

〒103-0004
東京都中央区東日本橋2-1-6 東日本橋藤和ビル5F
アンテナハウス株式会社
◆ご購入に関するお問い合わせ(祝日を除く月~金曜日9:30~18:00)
TEL : 03-5829-9021
FAX : 03-5829-9023
E-mail: sis@antenna.co.jp
URL : http://www.antenna.co.jp/

Office Server Document Converter は、Microsoft Office, PDF などのファイルを、PDF, Flash, SVG, 各種画像形式にダイレクトに変換する変換エンジンです。 ダイレクト変換の意味は、たとえば、Microsoft Office がない環境でも、ファイルさえあれば、それをダイレクトに内容を見える形式に変換できるのです。ダイレクト変換には、Microsoft Office のライセンスも不要です。
Office Server Document Converter は、ダイレクト変換というユニークさが評価され、多くのウェブサービス、パブリッククラウド、プライベートクラウドなどで利用されています。

Office Server Document Converter に関する詳しい情報は、
Office Server Document Converter
を、ぜひ、ご覧ください。

評価版もご用意しております。
Office Server Document Converter 評価版のお申し込み
から、お申し込みください。


TextPorter & Office Server Document Converter(Server Based Converter含む) のメンテナンスリリースについて

TextPorter 、及び、Office Server Document Converter(Server Based Converter 含む) のメンテナンスリリースについて紹介させていただきます。
各製品をお使いのお客様で、弊社と保守契約を結んでいらっしゃるお客様には、バグ修正を行ったメンテナンスリリース (MR) を配布しております。

ご提供間隔としては、

  1. 最新版につきましては、従来通り、おおよそ3ヵ月に1回、年4回を目安とした配布
  2. 最新版以外のバージョンにつきましては、おおよそ半年に1回、年2回を目安とした配布

としております。何卒、ご活用ください。

<TextPorter>
2017年11月中(早ければ2017/11/17頃の予定です)に V5.4MR3 のリリースを予定しております。
前回(V5.4MR2)までの改訂内容に関しては、こちらをご参照ください。

<Office Server Document Converter(Server Based Converter 含む)>

2017/11/16 に Office Server Document Converter V6.1 MR1 と Server Based Converter V6.0 MR4 をリリースいたしました。

Office Server Document Converter V6.1 MR1 改定情報
Server Based Converter V6.0 MR3 改定情報

他のバージョンに関しては、次回(2018年3月以降)にリリース予定です。

各バージョンの保守期限に関しては、以下のページにてご確認ください。

保守期限

Office Server Document Converter(Server Based Converter 含む) は、Microsoft Office, PDF などのファイルを、PDF, Flash, SVG, 各種画像形式にダイレクトに変換する変換エンジンです。 ダイレクト変換の意味は、たとえば、Microsoft Office がない環境でも、ファイルさえあれば、それをダイレクトに内容を見える形式に変換できるのです。ダイレクト変換には、Microsoft Office のライセンスも不要です。
Office Server Document Converter(Server Based Converter含む) は、ダイレクト変換というユニークさが評価され、多くのウェブサービス、パブリッククラウド、プライベートクラウドなどで利用されています。

Office Server Document Converter(Server Based Converte r含む) に関する詳しい情報は、
Office Server Document Converter(Server Based Converter 含む)
を、ぜひ、ご覧ください。

評価版もご用意しております。
Office Server Document Converter 評価版のお申し込み
から、お申し込みください。


アンテナハウスのシステム製品を「やりたいこと」から選ぶページを用意しました。

本日(11月16日)より、アンテナハウスのシステム製品を「やりたいこと」、「したいこと」から選ぶことのできる製品ナビゲータ(目次)を用意しました。

このページでは、過去にシステム製品の問い合わせ窓口にいただきました質問を下記の9つの大分類に分けました。

1. 自動組版
2. Office文書の変換
3. PDFデータ利用
4. テキスト抽出
5. CAD変換
6. スキャナ保存
7. 署名・タイムスタンプ
8. 動作環境
9. 処理性能など

さらに、各大分類で、より詳しい小分類をたてて、質問を登録した上で、質問-回答の形式で整理してみました。

ぜひ、一度お試しいただきたいと存じます。


OCRを使いこなそう…(3)

前回 に続いて、PDF 変換ユーティリティ 『瞬簡PDF 変換 9』 の OCR 補正機能についてご説明します。

「OCR結果を補正…」を選択すると、OCR 補正機能で元の画像を表示します。

リボンメニューから「領域認識」ボタンをクリックしてください。
領域認識を実行

OCR 処理で画像をどのようなレイアウトで認識したかが分かりやすく表示されます。
赤枠で示された部分は横書きのテキスト領域、青枠で示された部分は画像領域、緑色で示された部分は表の領域を示しています。

問題の宛名部分は青枠で囲まれ、画像領域として認識されていたことが分かります。
これをテキスト領域に変更してやればよさそうです。

変更したい部分を選択して、リボンメニューから「文字横書き」ボタンをクリックします。
領域を変更

これで選択した箇所が赤枠で示されて横書きのテキスト領域に変更されます。
リボンメニューから「変換実行」ボタンをクリックしてみましょう。
変換を実行

変換が終了後、変換結果を Excel で表示すると宛名部分がテキストで変換されたことが確認できます。
補正された変換結果
OCR による誤認識を100%防止することは難しいものですが、OCR 補正機能を利用して作業の効率アップにつなげていただければ幸いです。

—————————
「瞬簡PDF 変換 9」は体験版をご用意しております。
これにより、変換精度や使い勝手を事前にご確認いただくことができます。

体験版では以下のような制限がありますので、あらかじめご了承ください。

  • インストールしてから 15日を過ぎると利用できなくなります。
  • ひとつの PDF について、3ページまで変換可能です。
  • 評価以外の目的で日常業務に利用することはできません。

体験版に関する詳細は、『瞬簡PDF 変換 9 体験版のお申し込み』 をご参照ください。

<< OCRを使いこなそう…(2)


OCRを使いこなそう…(2)

本日は、PDF 変換ユーティリティ 『瞬簡PDF 変換 9』 の OCR 補正機能についてご説明します。

以下のような画像を Excel に変換してみます。
サンプル画像

『瞬簡PDF 変換 9』 の既定値で変換すると以下のようになります。
既定値の変換結果

納品書の宛先部分が Excel で画像になってしまっています。
これは、本来テキストで認識してもらいたい部分ですが、OCR 処理では画像と誤認識してしまったようです。
Excel 上で元のテキストに編集し直すのは手間がかかります。

このような時、OCR 補正機能がお役にたちます。
元のファイル名を右クリックして表示されたメニューから「OCR結果を補正…」を選択してください。
OCR補正機能の呼び出し

—————————
「瞬簡PDF 変換 9」は体験版をご用意しております。
これにより、変換精度や使い勝手を事前にご確認いただくことができます。

体験版では以下のような制限がありますので、あらかじめご了承ください。

  • インストールしてから 15日を過ぎると利用できなくなります。
  • ひとつの PDF について、3ページまで変換可能です。
  • 評価以外の目的で日常業務に利用することはできません。

体験版に関する詳細は、『瞬簡PDF 変換 9 体験版のお申し込み』 をご参照ください。

<< OCRを使いこなそう…(1)      OCRを使いこなそう…(3) >>


OCRを使いこなそう…(1)

朝夕だいぶ冷え込むようになってきました。
弊社伊那支店の裏手には小さな川があって、その先はずっと田んぼが広がっています。
夏の頃には緑一色の中に真っ白なコサギが何羽も舞い降りてエサを探す様子が見えましたが、この頃は枯れ草色の田んぼに秋のやわらかな日が差し、遠くの山々の紅葉が秋の深まりを感じさせてくれるようになりました。

さて、皆さんは「OCR(オーシーアール)」というコトバをご存じでしょうか?

OCR は、Optical Caracter Recognition(光学的文字認識)の頭文字をとったもので、紙に印刷された文字をスキャナなどで読み取り、コンピュータで利用できる文字データに変換するソフトウェア技術です。

紙に印刷された情報はいったんスキャナなどでイメージデータに変換し、さらに OCR 処理をかけることで文字検索したり文書ソフトで編集するなど、再利用が可能なデジタル情報となります。
弊社の PDF 変換ユーティリティ 『瞬簡PDF 変換 9』 は OCR 処理を搭載して、スキャナで作成した PDF やイメージデータから Word や Excel への変換を実現しています。

ただし、OCR は100%の読取りを保証できるものではありません。
OCR はイメージデータの中から特徴的な点の集合を抽出して文字の形を認識しますが、元の画像に歪み、汚れ、滲み、かすれなどがあると正しい認識ができません。
また、イメージデータには文字だけでなく写真や線の情報なども含まれるので、それらを適確に判別できないと正しい認識ができません。

OCR で文字化けが発生する原因としては概ね以下のことが考えられます。

  1. 紙の原稿にかすれや汚れがある場合
  2. 文字の上に網掛けや線が重なったり、文字と文字の間隔が狭い場合
  3. スキャナで読み取る際に文字の解像度が低かったり、歪みがある場合
  4. 文字に傾きや装飾があったり、文字の字体が特殊である場合
  5. OCR 処理で文字領域、画像領域などのレイアウトを正しく判別できない場合

瞬簡PDF 変換 9』 の OCR 処理でも残念ながらの上記の1.~4.は対応が難しく、その場合は原稿の取り直しをしていただくか、変換結果を手作業で修正していただくことをお願いしております。
ただし、5.に関しては手作業ではありますが、変換前に誤認識を予防する手段として OCR 補正機能をご用意しています。
OCR補正機能

次回 は、この機能について詳しくご説明します。

—————————
「瞬簡PDF 変換 9」は体験版をご用意しております。
これにより、変換精度や使い勝手を事前にご確認いただくことができます。

体験版では以下のような制限がありますので、あらかじめご了承ください。

  • インストールしてから 15日を過ぎると利用できなくなります。
  • ひとつの PDF について、3ページまで変換可能です。
  • 評価以外の目的で日常業務に利用することはできません。

体験版に関する詳細は、『瞬簡PDF 変換 9 体験版のお申し込み』 をご参照ください。

OCRを使いこなそう…(2)>>


Pages: 1 2 3 4 5 6 7 8 9 10 ... 158 159 160 Next