タグ別アーカイブ: PDF変換

『AntennaHouse AHPDFXML 変換ライブラリ』の用途は?

『AntennaHouse AHPDFXML 変換ライブラリ』は PDF を XML に変換するライブラリです。お客様から、XML に変換することでどのような用途に利用できるか?との問い合わせを度々頂きます。

そこで今回は、XML 変換することで、どのような事が出来るのか、活用方法をいくつかご紹介致します。

  • PDF コンテンツの活用
    ・PDF に入っている画像を抜き出し、画像の活用。
    ・表だけを抜き出し、データベースへ転用。
  • 位置情報の取得で、意味のあるテキストを抜き出し
    ・帳票の決まった位置にあるテキストを取得して帳票の振り分けや、データベースへ転用。
  • PDF からの変換、再構築
    弊社 AHFormatter を合わせて利用することで、
    ・PDF から HTML、EPUB、DocBook 形式等への変換に利用。
    ・元の PDF のレイアウトを変更して再度 PDF の生成に利用。
  • PDF チェッカーとして活用
    ・出力した XML を比較して改定箇所のチェックに利用。
    ・フォント(フォントタイプ・サイズ)情報、版面のサイズを取得。

評価版をご用意しております。
AntennaHouse AHPDFXML 変換ライブラリ 評価版のお申し込み

是非使ってみてください。

AntennaHouse AHPDFXML 変換ライブラリ
http://www.antenna.co.jp/pdfxml/


「瞬簡PDF統合版」と「瞬簡PDF統合版官公庁向け」の違い

「瞬簡PDF統合版10」の発売は来週です!!

来る10月27日、お待たせしております「瞬簡PDF 統合版 10」(以下、通常版と表記)の販売を開始いたします。家電量販店の店頭販売やネットショップ、弊社のオンラインショップ等で一斉に販売されます。

瞬簡PDF 統合版 10」は、前バージョン「瞬簡PDF 統合版 9」と製品の構成は変わっていません。「瞬簡PDF 作成 7」を「瞬簡PDF 作成 8」へ、「瞬簡PDF 編集 6」を「瞬簡PDF 編集 7」へ、それぞれバージョンアップしています。特に新バージョン「瞬簡PDF 編集 7」は多くの機能追加や機能向上を実現した、今回一押しの製品です。

ところで、「瞬簡PDF 統合版 10」(通常版)に先んずること3か月も前の8月から、「瞬簡PDF 統合版 10 官公庁向け」という製品を先行販売しています。以下、官公庁向けと通常版の違いやご購入等について簡単にご紹介します。

「瞬簡PDF統合版10 官公庁向け」は2つの製品を追加

瞬簡PDF 統合版 10」(通常版)に対して、「瞬簡PDF to Image」と「瞬簡PDF サイン2」を追加した製品が「瞬簡PDF 統合版 10 官公庁向け」になります。

「瞬簡PDF to Image」は単体販売していますので、個別に追加購入することも可能ですが、「瞬簡PDF サイン2」は単独での販売は行っておりません。もし、PDFの電子署名付与や検証などが製品の要件としてあるようでしたら、「瞬簡PDF サイン2」を含む「瞬簡PDF 統合版 10 官公庁向け」をぜひご検討ください。

なお、「瞬簡PDF 統合版 10 官公庁向け」は製品名に「官公庁」と入っておりますが、ご利用を官公庁様のみに限定しているものではなく、民間の企業様、団体様も特に支障なくご利用いただける製品です。

瞬簡PDF 統合版 10 官公庁向け」の販売形態はサイトライセンス(10ライセンス以上)など企業・団体様向けライセンス販売のみで、単品でのお取り扱はございません。価格はデスクトップ製品のライセンスのページをご覧ください。


PDF Server V3.1 についてのお知らせ。

メンテナンスリリース5の公開
製品ページにも掲載していますが、先月 8/17にMR5とCADオプションのMR2を公開しております。

  • フルカラー画像の変換過程で、内容によっては意図しない最適化が行われ、グレースケールに減色されてしまう問題を修正
  • 不要なケースでもPDFのテキスト抽出処理が内部で実施されてしまい、ページ数の多い文書で速度低下を招いていた問題を修正
  • CAD版/CADオプションの変換エンジンを最新版に更新

保守期間中のユーザー様であれば無償で更新いただけます。
詳細はこちらからご確認いただけます。

  • 体験版について
    PDF Server には30日間、製品と同じ機能を全てご利用いただける体験版を用意しております。
    体験版のお申し込みはこちらからお願いします。

 

製品ページ:

製品お問合せ:システム営業グループ
TEL:03-5829-9021  e-mail:sis@antenna.co.jp


Office Server Document Converter の活用法(2)

■ TextPorterと組み合わせた文書管理システム

企業や組織においては、毎日、膨大な数の文書が、Microsoft Office で作られています。それを紙に印刷していたのでは、保管も閲覧も大変です。そこで、これらの文書を電子文書のままファイリングし、管理する文書管理システムが作られています。
ここで、Office Server Document Converter と、弊社のサーバ製品の1つである TextPorter が活躍しています。TextPorter は、Microsoft Office 文書やPDFから、テキストを抽出する製品です。

システムのイメージは、
Office Server Document Converter 活用例
にある
サムネイルサーバ
を発展させたものと思っていただけるといいです。

Office Server Document Converter によって、文書からサムネイルを生成することで、ファイル名だけではわかりにくい文書の見分けも簡単にできるようになります。
そして、TextPorter で文書からテキストを抽出して、全文検索システムで検索できるようにしておくことで、目的の文書をすばやく探し出して、そのサムネイルをみて、実際の文書を引っ張り出せるようにするわけです。

TextPorterに関する詳しい情報は、
http://www.antenna.co.jp/axx/
を、ぜひ、ご覧ください。

〒103-0004
東京都中央区東日本橋2-1-6 東日本橋藤和ビル5F
アンテナハウス株式会社
◆ご購入に関するお問い合わせ(祝日を除く月~金曜日9:30~18:00)
TEL : 03-5829-9021
FAX : 03-5829-9023
E-mail:sis@antenna.co.jp
URL : http://www.antenna.co.jp/

Office Server Document Converter は、Microsoft Office, PDF などのファイルを、PDF, Flash, SVG, 各種画像形式にダイレクトに変換する変換エンジンです。 ダイレクト変換の意味は、たとえば、Microsoft Office がない環境でも、ファイルさえあれば、それをダイレクトに内容を見える形式に変換できるのです。ダイレクト変換には、Microsoft Office のライセンスも不要です。
Office Server Document Converter は、ダイレクト変換というユニークさが評価され、多くのウェブサービス、パブリッククラウド、プライベートクラウドなどで利用されています。

Office Server Document Converter に関する詳しい情報は、
Office Server Document Converter
を、ぜひ、ご覧ください。

評価版もご用意しております。
Office Server Document Converter 評価版のお申し込み
から、お申し込みください。


Office Server Document Converter の活用法(1)

■ ファイルの無害化

Office Server Document Converter は、Microsoft Office 文書の変換においてマクロを実行しません。 したがって、マクロ内に不正なコードが合った場合にもその実行は行われずに PDF や画像、SVG, Flash といった形式のファイルを生成できます。
PDF に関しても Script を実行することはないので画像や SVG, Flash といった形式のファイルを生成できます。また、PDF から PDF への変換も可能です。
企業ユーザ様、特にグローバル企業では、様々なファイルを日々受け取っていることと思われます。そのような場合でもよりセキュアな状態でファイルを取り扱うことが可能となります。
また、官公庁や学校等で使用するファイルに関しても、Office Server Document Converter でいろいろな形式に変換することにより、より確実に無害化されたファイルを取り扱えるようになります。

Office Server Document Converter:PDF生成サーバ

〒103-0004
東京都中央区東日本橋2-1-6 東日本橋藤和ビル5F
アンテナハウス株式会社
◆ご購入に関するお問い合わせ(祝日を除く月~金曜日9:30~18:00)
TEL : 03-5829-9021
FAX : 03-5829-9023
E-mail: sis@antenna.co.jp
URL : http://www.antenna.co.jp/

Office Server Document Converter は、Microsoft Office, PDF などのファイルを、PDF, Flash, SVG, 各種画像形式にダイレクトに変換する変換エンジンです。 ダイレクト変換の意味は、たとえば、Microsoft Office がない環境でも、ファイルさえあれば、それをダイレクトに内容を見える形式に変換できるのです。ダイレクト変換には、Microsoft Office のライセンスも不要です。
Office Server Document Converter は、ダイレクト変換というユニークさが評価され、多くのウェブサービス、パブリッククラウド、プライベートクラウドなどで利用されています。

Office Server Document Converter に関する詳しい情報は、
Office Server Document Converter
を、ぜひ、ご覧ください。

評価版もご用意しております。
Office Server Document Converter 評価版のお申し込み
から、お申し込みください。


TextPorter & Office Server Document Converter(Server Based Converter含む) のメンテナンスリリースについて

TextPorter 、及び、Office Server Document Converter(Server Based Converter含む) のメンテナンスリリースについて紹介させていただきます。
各製品をお使いのお客様で、弊社と保守契約を結んでいらっしゃるお客様には、バグ修正を行ったメンテナンスリリース(MR)を配布しております。

ご提供間隔としては、

  1. 最新版につきましては、従来通り、おおよそ3ヵ月に1回、年4回を目安とした配布
  2. 最新版以外のバージョンにつきましては、おおよそ半年に1回、年2回を目安とした配布

としております。何卒、ご活用ください。

<TextPorter>
2017/05/19に「TextPorter V5.4 MR2(改訂第2版)」をリリースしました。
改訂内容に関しては、こちらをご参照ください。

<Office Server Document Converter(Server Based Converter含む)>
2017/7/14 に Office Server Document Converter V6.1 R1 と Server Based Converter V6.0 MR3 をリリースいたしました。

Office Server Document Converter V6.1 R1 ニュースリリース
Server Based Converter V6.0 MR3 改定情報

また、他のバージョンに関しても

2017/7/26にServer Based Converter V5.2 MR9をリリースいたしました。
2017/7/31にServer Based Converter V5.0 MR10をリリースいたしました。
2017/8/4にServer Based Converter V4.0 MR11をリリースいたしました。

Server Based Converter V5.2 MR9 改定情報
Server Based Converter V5.0 MR10 改定情報
Server Based Converter V4.0 MR11 改定情報

各バージョンの保守期限に関しては、以下のページにてご確認ください。

保守期限

Office Server Document Converter(Server Based Converter含む) は、Microsoft Office, PDF などのファイルを、PDF, Flash, SVG, 各種画像形式にダイレクトに変換する変換エンジンです。 ダイレクト変換の意味は、たとえば、Microsoft Office がない環境でも、ファイルさえあれば、それをダイレクトに内容を見える形式に変換できるのです。ダイレクト変換には、Microsoft Office のライセンスも不要です。
Office Server Document Converter(Server Based Converter含む) は、ダイレクト変換というユニークさが評価され、多くのウェブサービス、パブリッククラウド、プライベートクラウドなどで利用されています。

Office Server Document Converter(Server Based Converter含む) に関する詳しい情報は、
Office Server Document Converter(Server Based Converter含む)
を、ぜひ、ご覧ください。

評価版もご用意しております。
Office Server Document Converter 評価版のお申し込み
から、お申し込みください。


Web Interface for OSDC のリリース

Web Interface for OSDC』は、サーバ上のファイル変換ソフトをインターネット経由で遠方のクライアントから簡単に使用できる便利なソフトウェアです。サーバ側とクライアント側のパソコンに必要なソフトをインストールするだけで、新規にプログラムを開発することもなく、すぐに運用を開始できます。
変換には、『Office Server Document Converter V6.1』以降で使用できます。

インターネット経由でサーバ上のファイル変換ソフトにリクエストを送信し、結果をクライアントで受け取る方式です。クラウドを利用した大規模な Web サービスシステムも簡単に構築できます。

サーバ側とクライアント側のパソコンに必要なソフトをインストールするだけで、すぐに運用を開始できます。クライアントからのリクエストは『Office Server Document Converter』のコマンドラインインターフェイスと同じパラメータを用いたバイナリを提供します。コマンドのサンプルも多種ご用意しています。

Web Interface for OSDC』は、サーバプログラムとクライアントプログラム、フォルダ監視サービスから構成されます。各プログラムは Java で設計されており異なるプラットフォームの相互間でインターネットを超えて連携することができます。

【基本機能】

  • プログラムレスでサーバ運用が可能
  • 簡単なコマンドでリクエスト送信
  • Windows、Linux の相互間で通信
  • フォルダ監視サービスで更に簡単利用

詳しくは、Web Interface for OSDCをご覧ください。

〒103-0004
東京都中央区東日本橋2-1-6 東日本橋藤和ビル5F
アンテナハウス株式会社
◆ご購入に関するお問い合わせ(祝日を除く月~金曜日9:30~18:00)
TEL : 03-5829-9021
FAX : 03-5829-9023
E-mail: sis@antenna.co.jp
URL : http://www.antenna.co.jp/

Office Server Document Converter は、Microsoft Office, PDF などのファイルを、PDF, Flash, SVG, 各種画像形式にダイレクトに変換する変換エンジンです。 ダイレクト変換の意味は、たとえば、Microsoft Office がない環境でも、ファイルさえあれば、それをダイレクトに内容を見える形式に変換できるのです。ダイレクト変換には、Microsoft Office のライセンスも不要です。
Office Server Document Converter は、ダイレクト変換というユニークさが評価され、多くのウェブサービス、パブリッククラウド、プライベートクラウドなどで利用されています。

Office Server Document Converter に関する詳しい情報は、
Office Server Document Converter
を、ぜひ、ご覧ください。

評価版もご用意しております。
Web Interface for OSDC 評価版のお申し込み
から、お申し込みください。


SBC と OSDC の相違点

Server Based Converter V6.0 と Office Server Document Converter V6.1 の機能的な差はありません。Server Based Converter V6.0 MR3 と Office Server Document Converter V6.1 R1 は、ほぼ同じ Source で作成されております。その関係は、今後も販売終了まで継続されます。

Server Based Converter V6.0 と Office Server Document Converter V6.1 の違いは、

1)製品名称
2)一部モジュールの名称変更
3)製品カテゴリの追加
4)Flash出力版の廃止
5)Web Interfaceの追加

となります。

【一部モジュールの名称変更】
弊社別製品にて使用している同一名称のライブラリのバージョンが異なる場合があるため、問題が発生する場合がありました。この問題を解消するため Server Based Converter で使用している以下の名称を変更いたします。

対象ライブラリ

・Windows版

<変更前>
AHFontService14.dll
AHGraphicService11.dll
AHDMC13.dll
AHCommon13.dll
AHPDFLib12.dll

<変更後>
DfvAHFontService14.dll
DfvAHGraphicService11.dll
DfvAHDMC13.dll
DfvAHCommon13.dll
DfvAHPDFLib12.dll

・Linux版

<変更前>
libAHGraphicService.so
libGL.so
libOSMesa.so
libGLU.so
libAHDMC.so
libAHCommon.so
libAHPDFLib.so
libAHFontService.so.1.4
libPdfiumModule.so
<変更後>
libDfvAHGraphicService.so
libDfvGL.so
libDfvOSMesa.so
libDfvGLU.so
libDfvAHDMC.so
libDfvAHCommon.so
libDfvAHPDFLib.so
libDfvAHFontService.so.1.4
libDfvPdfiumModule.so

*法則としては、Windows版は、【Dfv】+【旧名称】となり、Linux版は【lib】+【Dfv】+【旧名称】となります。

【製品カテゴリの追加】
製品カテゴリを一部変更し、Microsoft Word/Excel/PowerPoint の各読込に限定(一部例外あり)した「Select 」版を設けます。
価格などは、こちらをご確認ください。

【Flash出力版の廃止】
Flash 出力版の販売終了しました。Flash 出力が必要な場合は、Professional 版をご購入ください。

なお、個別契約となる OEM(組込み)契約や ASP/SaaS 契約の場合は、そのご契約内容毎にこれからも販売していきます。

【開発環境の変更】
OSDC は、以下の開発環境で作成されています。

・Windows版

<C/C++>
Microsoft Visual C++ 2015 でビルドされています。SampleGUI を除き、MFC は使われていません。 呼び出し側のプログラムは、互換性のあるコンパイラをご使用ください。

<.NET Framework 4.0/4.5.x/4.6 (DfvDotNet40Ctl60.dll) VisualStudio 2010>
VisualStudio 2012
VisualStudio 2013
VisualStudio 2015

<JAVA>
Java SE 8

・Linux版

<C/C++>
gcc 4.8

<JAVA>
Java SE 8

*動作には、libc.so.6(glibc-2.17), libstdc++.so.6 で、これらとバイナリ互換性があるライブラリが必要です。
*Linux版に関しては、Distribution を指定しての動作保証はしておりませんが、OSDC に必要な開発環境の入手が難しい場合は、CentOS7以降を推奨いたします。

【Web Interface for OSDC】
インターネットでプログラムレスの変換を実現できる『Web Interface for OSDC』を同時に販売しまた。

〒103-0004
東京都中央区東日本橋2-1-6 東日本橋藤和ビル5F
アンテナハウス株式会社
◆ご購入に関するお問い合わせ(祝日を除く月~金曜日9:30~18:00)
TEL : 03-5829-9021
FAX : 03-5829-9023
E-mail: sis@antenna.co.jp
URL : http://www.antenna.co.jp/

Office Server Document Converter は、Microsoft Office, PDF などのファイルを、PDF, Flash, SVG, 各種画像形式にダイレクトに変換する変換エンジンです。 ダイレクト変換の意味は、たとえば、Microsoft Office がない環境でも、ファイルさえあれば、それをダイレクトに内容を見える形式に変換できるのです。ダイレクト変換には、Microsoft Office のライセンスも不要です。
Office Server Document Converter は、ダイレクト変換というユニークさが評価され、多くのウェブサービス、パブリッククラウド、プライベートクラウドなどで利用されています。

Office Server Document Converter に関する詳しい情報は、
Office Server Document Converter
を、ぜひ、ご覧ください。

評価版もご用意しております。
Office Server Document Converter 評価版のお申し込み
から、お申し込みください。


PDFをWordやExcelに変換したいけれど、どんな製品がいいのかよく分からない…(2)

PDFを再利用する場合、元となるPDFは内容によって以下の2種類に分けることができます。

1)テキストが含まれているPDF
2)テキストが含まれない画像だけのPDF

1)の「テキストが含まれているPDF」とは、WordやExcelなどで文字入力しPDF化したものが該当します。
このようなPDFからの変換には、『瞬簡PDF 変換 9』が適しています。

瞬簡PDF 変換 9』は、PDFにテキスト・データが含まれていればそれを解析してWordやExcelに変換します。テキスト・データをそのまま変換するため文字化けしたりすることなくWordやExcel形式に移して再利用可能になります。

変換されたいPDFにテキスト・データが含まれるかどうかは、Adobe Reader などでPDFを表示して[編集]メニューから[すべて選択]をクリックしてみてください。
テキスト・データが以下のように反転表示されれば、テキストが含まれるPDFだと判別できます(※)。

pdf

テキストをすべて選択

 

※ スキャナーで作成された画像には、スキャナーがOCR処理をかけてテキスト・データをPDFに埋め込むことがあります(透明テキストつきPDF)。この場合は同じようにテキスト部分が反転して表示されます。

2)の「テキストが含まれない画像だけのPDF」とは、紙の書類をスキャナーで読み取ってPDF化したものなどが該当します。
このようなPDFは文字と見える部分も画像でしかないため、そのままWordやExcel形式に変換しても編集のできない画像が貼り付きます。
このようなデータに対しては「OCR」といって画像から文字を認識する機能を使うことでテキスト・データを取り出すことができます。ただし、OCR処理では画像の状態により文字が正しく認識できず、文字化けしてしまうことがあるため注意が必要です。

紙に印刷された内容をWordやExcelで再利用されたい場合は、『瞬簡PDF OCR』が適しています。

瞬簡PDF OCR』はOCR専用製品で、スキャナーからの直接読み込みにも対応しています。
読み込んだ画像はOCR処理し、誤認識した文字を画面上で修正したり編集したりしながら、変換結果に反映させることができます。
(製品の仕様上、常にOCR処理をかけるため、テキスト・データがあらかじめ含まれているPDFを変換する用途には適しません。)

なお、『瞬簡PDF 変換 9』にもOCR機能があり、画像データからテキスト・データを認識して変換することができます。
ただし、スキャナーからの読み込み機能や誤認識した文字を画面上で修正する機能はありません。

瞬簡PDF OCR』は紙の書類の再利用をされたい場合に適しているのに対し、『瞬簡PDF 変換 9』は内容に関わらず複数のPDFを一括して変換されたいような場合に適していると言えます。

どういったPDFを再利用されたいかによって、いずれの製品を選択するかご検討いただければ幸いです。

PDFをWordやExcelに変換したいけれど、望み通りに変換してくれるか心配…

PDFをWordやExcelに変換したいとお考えの場合、どれだけ正確に変換できるかが気になることと思います。
上記2つの製品にはそれぞれ体験版をご用意しておりますので、その変換精度や使い勝手を事前にご確認いただくことができます。

ただし、体験版では以下のような制限がありますので、あらかじめご了承ください。

  • インストールしてから 15日を過ぎると利用できなくなります。
  • ひとつのPDFについて、3ページまで変換可能です。
  • 評価以外の目的で日常業務に利用することはできません。

体験版に関する詳細は、『瞬簡PDF 変換 9 体験版のお申し込み』、または『瞬簡PDF OCR 体験版のお申し込み』をそれぞれご参照ください。


PDFをWordやExcelに変換したいけれど、どんな製品がいいのかよく分からない…(1)

弊社伊那支店の近くには、春に桜で賑わう高遠という町があります。
江戸時代は高遠藩の城下町だったところで、そこかしこに古い時代の面影が残り普段はとても閑かな町です。
そこは、高遠石工と呼ばれる石工集団が活躍したところでもあり、城下の寺には名工といわれた守屋貞治が刻んだ数々の仏さまが遺されています。

正観世音菩薩

正観世音菩薩

写真が下手でうまく伝えられませんが、石なのに柔らかくて温かい表情が何ともいえず好きです。時間と興味のある方は、是非一度現地を訪ねてみてください。

閑話休題。

PDFは紙に代わるデジタルな文書形式として、すっかり身近なものになりました。もともとは閲覧や印刷用途で普及したPDFですが、WordやExcelのように自由に編集して再利用したいというニーズも必然的に増えています。

そのようなニーズに応えてご用意しているのが、弊社のパッケージ製品『瞬簡PDF 変換 9』と『瞬簡PDF OCR』です。

いずれも、PDFをWord(ワード)/Excel(エクセル)/PowerPoint(パワーポイント) の各文書形式に変換することでPDFの再利用が可能な製品です。

なぜPDFから変換をするのに2つも種類があるの? とは、よくお問い合わせをいただくご質問です。

次回は、2つの製品の違いを元になるPDFの観点からご説明します。


Pages: 1 2 3 Next