「Antenna House PDFXML 変換ライブラリ V2.0」メンテナンスリリースについて

2017年11月22日に、Antenna House PDFXML 変換ライブラリ V2.0 MR1 をリリースしました。

V2.0R1a と V2.0MR1 の相違点

  • 縦書き/横書き混在の CID フォントを使用使用している場合に、縦書き用記号から縦書きページを判断する処理を追加しました。
  • 縦線の結合処理において、余分な結合が発生する場合が有りましたので、調整しました。
  • 縦書きページに存在する横書きの数字をページ番号と判断する処理を修正しました。
  • セルの縦横結合の解析処理を改善しました。
  • セルのデータが一部出力されない不具合を修正しました。
  • 文字データが一部消えてしまう不具合に対応しました。
  • 画像ファイルの出力オプションに EMF を追加しました。
  • Antenna House PDFXML の仕様を修正しました。
Element/Attributes/Types 名前 区分 説明
Element ahp:font 追加 アトリビュート”rotation”を追加しました。
Element ahp:style 追加 アトリビュート”line-distance”を追加しました。

「Antenna House PDFXML 変換ライブラリ V2.0」は、PDF ファイルの内部データを、XML(Extensible Markup Language:拡張可能なマークアップ言語)形式に変換するプログラムです。 このライブラリが出力する XML 形式を「Antenna House PDFXML形式」と呼びます。
PDF 解析技術により文書構造を生成して、再利用に適した XML データを出力します。 XML で表現することによって、データの扱いが容易になります。
XML のメリットを最大限に活かして PDF データを活用できます。
弊社ウエブサイトより評価版の申し込みが可能です。是非ご評価ください。

製品に関するご質問は
sis@antenna.co.jp
または
oem@antenna.co.jp(OEM担当)
まで、お気軽にお問い合わせください。

評価版のお申込
評価版のお申込ページ

Webページ
http://www.antenna.co.jp/pdfxml/


Office Server Document Converter の活用法(1)

■ ファイルの無害化

Office Server Document Converter は、Microsoft Office 文書の変換においてマクロを実行しません。
したがって、マクロ内に不正なコードが合った場合にもその実行は行われずにPDFや画像、SVG, Flash といった形式のファイルを生成できます。
PDF に関しても Script を実行することはないので画像や SVG, Flash といった形式のファイルを生成できます。また、PDF から PDF への変換も可能です。
企業ユーザ様、特にグローバル企業では、様々なファイルを日々受け取っていることと思われます。そのような場合でもよりセキュアな状態でファイルを取り扱うことが可能となります。
また、官公庁や学校等で使用するファイルに関しても、Office Server Document Converter でいろいろな形式に変換することにより、より確実に無害化されたファイルを取り扱えるようになります。

Office Server Document Converter:PDF生成サーバ

〒103-0004
東京都中央区東日本橋2-1-6 東日本橋藤和ビル5F
アンテナハウス株式会社
◆ご購入に関するお問い合わせ(祝日を除く月~金曜日9:30~18:00)
TEL : 03-5829-9021
FAX : 03-5829-9023
E-mail: sis@antenna.co.jp
URL : http://www.antenna.co.jp/

Office Server Document Converter は、Microsoft Office, PDF などのファイルを、PDF, Flash, SVG, 各種画像形式にダイレクトに変換する変換エンジンです。 ダイレクト変換の意味は、たとえば、Microsoft Office がない環境でも、ファイルさえあれば、それをダイレクトに内容を見える形式に変換できるのです。ダイレクト変換には、Microsoft Office のライセンスも不要です。
Office Server Document Converter は、ダイレクト変換というユニークさが評価され、多くのウェブサービス、パブリッククラウド、プライベートクラウドなどで利用されています。

Office Server Document Converter に関する詳しい情報は、
Office Server Document Converter
を、ぜひ、ご覧ください。

評価版もご用意しております。
Office Server Document Converter 評価版のお申し込み
から、お申し込みください。


SBC と OSDCの 相違点

Server Based Converter V6.0 と Office Server Document Converter V6.1 の機能的な差はありません。Server Based Converter V6.0 MR4 と Office Server Document Converter V6.1 MR1 は、ほぼ同じ Source で作成されております。その関係は、今後も販売終了まで継続されます。

Server Based Converter V6.0 と Office Server Document Converter V6.1 の違いは、

1) 製品名称
2) 一部モジュールの名称変更
3) 製品カテゴリの追加
4) Flash 出力版の廃止
5) Web Interface の追加

となります。

【一部モジュールの名称変更】
弊社別製品にて使用している同一名称のライブラリのバージョンが異なる場合があるため、問題が発生する場合がありました。この問題を解消するため Server Based Converter で使用している以下の名称を変更いたします。

対象ライブラリ

・ Windows 版

<変更前>
AHFontService14.dll
AHGraphicService11.dll
AHDMC13.dll
AHCommon13.dll
AHPDFLib12.dll

<変更後>
DfvAHFontService14.dll
DfvAHGraphicService11.dll
DfvAHDMC13.dll
DfvAHCommon13.dll
DfvAHPDFLib12.dll

・ Linux 版

<変更前>
libAHGraphicService.so
libGL.so
libOSMesa.so
libGLU.so
libAHDMC.so
libAHCommon.so
libAHPDFLib.so
libAHFontService.so.1.4
libPdfiumModule.so
<変更後>
libDfvAHGraphicService.so
libDfvGL.so
libDfvOSMesa.so
libDfvGLU.so
libDfvAHDMC.so
libDfvAHCommon.so
libDfvAHPDFLib.so
libDfvAHFontService.so.1.4
libDfvPdfiumModule.so

*法則としては、Windows 版は、【Dfv】+【旧名称】となり、Linux版は【lib】+【Dfv】+【旧名称】となります。

【製品カテゴリの追加】
製品カテゴリを一部変更し、Microsoft Word/Excel/PowerPoint の各読込に限定(一部例外あり)した「Select 」版を設けます。
価格などは、こちら をご確認ください。

【Flash 出力版の廃止】
Flash 出力版の販売終了しました。Flash 出力が必要な場合は、Professional 版をご購入ください。

なお、個別契約となる OEM(組込み)契約や ASP/SaaS 契約の場合は、そのご契約内容毎にこれからも販売していきます。

【開発環境の変更】
OSDC は、以下の開発環境で作成されています。

・ Windows 版

<C/C++>
Microsoft Visual C++ 2015 でビルドされています。SampleGUI を除き、MFC は使われていません。 呼び出し側のプログラムは、互換性のあるコンパイラをご使用ください。

<.NET Framework 4.0/4.5.x/4.6 (DfvDotNet40Ctl60.dll) VisualStudio 2010>
VisualStudio 2012
VisualStudio 2013
VisualStudio 2015

<JAVA>
Java SE 8

・ Linux 版

<C/C++>
gcc 4.8

<JAVA>
Java SE 8

*動作には、libc.so.6(glibc-2.17), libstdc++.so.6 で、これらとバイナリ互換性があるライブラリが必要です。
*Linux 版に関しては、Distribution を指定しての動作保証はしておりませんが、OSDC に必要な開発環境の入手が難しい場合は、CentOS7 以降を推奨いたします。

【Web Interface for OSDC】
インターネットでプログラムレスの変換を実現できる 『Web Interface for OSDC』 を同時に販売しまた。

〒103-0004
東京都中央区東日本橋2-1-6 東日本橋藤和ビル5F
アンテナハウス株式会社
◆ご購入に関するお問い合わせ(祝日を除く月~金曜日9:30~18:00)
TEL : 03-5829-9021
FAX : 03-5829-9023
E-mail: sis@antenna.co.jp
URL : http://www.antenna.co.jp/

Office Server Document Converter は、Microsoft Office, PDF などのファイルを、PDF, Flash, SVG, 各種画像形式にダイレクトに変換する変換エンジンです。 ダイレクト変換の意味は、たとえば、Microsoft Office がない環境でも、ファイルさえあれば、それをダイレクトに内容を見える形式に変換できるのです。ダイレクト変換には、Microsoft Office のライセンスも不要です。
Office Server Document Converter は、ダイレクト変換というユニークさが評価され、多くのウェブサービス、パブリッククラウド、プライベートクラウドなどで利用されています。

Office Server Document Converter に関する詳しい情報は、
Office Server Document Converter
を、ぜひ、ご覧ください。

評価版もご用意しております。
Office Server Document Converter 評価版のお申し込み
から、お申し込みください。


TextPorter & Office Server Document Converter(Server Based Converter含む) のメンテナンスリリースについて

TextPorter 、及び、Office Server Document Converter(Server Based Converter 含む) のメンテナンスリリースについて紹介させていただきます。
各製品をお使いのお客様で、弊社と保守契約を結んでいらっしゃるお客様には、バグ修正を行ったメンテナンスリリース (MR) を配布しております。

ご提供間隔としては、

  1. 最新版につきましては、従来通り、おおよそ3ヵ月に1回、年4回を目安とした配布
  2. 最新版以外のバージョンにつきましては、おおよそ半年に1回、年2回を目安とした配布

としております。何卒、ご活用ください。

<TextPorter>
2017年11月中(早ければ2017/11/17頃の予定です)に V5.4MR3 のリリースを予定しております。
前回(V5.4MR2)までの改訂内容に関しては、こちらをご参照ください。

<Office Server Document Converter(Server Based Converter 含む)>

2017/11/16 に Office Server Document Converter V6.1 MR1 と Server Based Converter V6.0 MR4 をリリースいたしました。

Office Server Document Converter V6.1 MR1 改定情報
Server Based Converter V6.0 MR3 改定情報

他のバージョンに関しては、次回(2018年3月以降)にリリース予定です。

各バージョンの保守期限に関しては、以下のページにてご確認ください。

保守期限

Office Server Document Converter(Server Based Converter 含む) は、Microsoft Office, PDF などのファイルを、PDF, Flash, SVG, 各種画像形式にダイレクトに変換する変換エンジンです。 ダイレクト変換の意味は、たとえば、Microsoft Office がない環境でも、ファイルさえあれば、それをダイレクトに内容を見える形式に変換できるのです。ダイレクト変換には、Microsoft Office のライセンスも不要です。
Office Server Document Converter(Server Based Converter含む) は、ダイレクト変換というユニークさが評価され、多くのウェブサービス、パブリッククラウド、プライベートクラウドなどで利用されています。

Office Server Document Converter(Server Based Converte r含む) に関する詳しい情報は、
Office Server Document Converter(Server Based Converter 含む)
を、ぜひ、ご覧ください。

評価版もご用意しております。
Office Server Document Converter 評価版のお申し込み
から、お申し込みください。


アンテナハウスのシステム製品を「やりたいこと」から選ぶページを用意しました。

本日(11月16日)より、アンテナハウスのシステム製品を「やりたいこと」、「したいこと」から選ぶことのできる製品ナビゲータ(目次)を用意しました。

このページでは、過去にシステム製品の問い合わせ窓口にいただきました質問を下記の9つの大分類に分けました。

1. 自動組版
2. Office文書の変換
3. PDFデータ利用
4. テキスト抽出
5. CAD変換
6. スキャナ保存
7. 署名・タイムスタンプ
8. 動作環境
9. 処理性能など

さらに、各大分類で、より詳しい小分類をたてて、質問を登録した上で、質問-回答の形式で整理してみました。

ぜひ、一度お試しいただきたいと存じます。


OCRを使いこなそう…(3)

前回 に続いて、PDF 変換ユーティリティ 『瞬簡PDF 変換 9』 の OCR 補正機能についてご説明します。

「OCR結果を補正…」を選択すると、OCR 補正機能で元の画像を表示します。

リボンメニューから「領域認識」ボタンをクリックしてください。
領域認識を実行

OCR 処理で画像をどのようなレイアウトで認識したかが分かりやすく表示されます。
赤枠で示された部分は横書きのテキスト領域、青枠で示された部分は画像領域、緑色で示された部分は表の領域を示しています。

問題の宛名部分は青枠で囲まれ、画像領域として認識されていたことが分かります。
これをテキスト領域に変更してやればよさそうです。

変更したい部分を選択して、リボンメニューから「文字横書き」ボタンをクリックします。
領域を変更

これで選択した箇所が赤枠で示されて横書きのテキスト領域に変更されます。
リボンメニューから「変換実行」ボタンをクリックしてみましょう。
変換を実行

変換が終了後、変換結果を Excel で表示すると宛名部分がテキストで変換されたことが確認できます。
補正された変換結果
OCR による誤認識を100%防止することは難しいものですが、OCR 補正機能を利用して作業の効率アップにつなげていただければ幸いです。

—————————
「瞬簡PDF 変換 9」は体験版をご用意しております。
これにより、変換精度や使い勝手を事前にご確認いただくことができます。

体験版では以下のような制限がありますので、あらかじめご了承ください。

  • インストールしてから 15日を過ぎると利用できなくなります。
  • ひとつの PDF について、3ページまで変換可能です。
  • 評価以外の目的で日常業務に利用することはできません。

体験版に関する詳細は、『瞬簡PDF 変換 9 体験版のお申し込み』 をご参照ください。

<< OCRを使いこなそう…(2)


OCRを使いこなそう…(2)

本日は、PDF 変換ユーティリティ 『瞬簡PDF 変換 9』 の OCR 補正機能についてご説明します。

以下のような画像を Excel に変換してみます。
サンプル画像

『瞬簡PDF 変換 9』 の既定値で変換すると以下のようになります。
既定値の変換結果

納品書の宛先部分が Excel で画像になってしまっています。
これは、本来テキストで認識してもらいたい部分ですが、OCR 処理では画像と誤認識してしまったようです。
Excel 上で元のテキストに編集し直すのは手間がかかります。

このような時、OCR 補正機能がお役にたちます。
元のファイル名を右クリックして表示されたメニューから「OCR結果を補正…」を選択してください。
OCR補正機能の呼び出し

—————————
「瞬簡PDF 変換 9」は体験版をご用意しております。
これにより、変換精度や使い勝手を事前にご確認いただくことができます。

体験版では以下のような制限がありますので、あらかじめご了承ください。

  • インストールしてから 15日を過ぎると利用できなくなります。
  • ひとつの PDF について、3ページまで変換可能です。
  • 評価以外の目的で日常業務に利用することはできません。

体験版に関する詳細は、『瞬簡PDF 変換 9 体験版のお申し込み』 をご参照ください。

<< OCRを使いこなそう…(1)      OCRを使いこなそう…(3) >>


OCRを使いこなそう…(1)

朝夕だいぶ冷え込むようになってきました。
弊社伊那支店の裏手には小さな川があって、その先はずっと田んぼが広がっています。
夏の頃には緑一色の中に真っ白なコサギが何羽も舞い降りてエサを探す様子が見えましたが、この頃は枯れ草色の田んぼに秋のやわらかな日が差し、遠くの山々の紅葉が秋の深まりを感じさせてくれるようになりました。

さて、皆さんは「OCR(オーシーアール)」というコトバをご存じでしょうか?

OCR は、Optical Caracter Recognition(光学的文字認識)の頭文字をとったもので、紙に印刷された文字をスキャナなどで読み取り、コンピュータで利用できる文字データに変換するソフトウェア技術です。

紙に印刷された情報はいったんスキャナなどでイメージデータに変換し、さらに OCR 処理をかけることで文字検索したり文書ソフトで編集するなど、再利用が可能なデジタル情報となります。
弊社の PDF 変換ユーティリティ 『瞬簡PDF 変換 9』 は OCR 処理を搭載して、スキャナで作成した PDF やイメージデータから Word や Excel への変換を実現しています。

ただし、OCR は100%の読取りを保証できるものではありません。
OCR はイメージデータの中から特徴的な点の集合を抽出して文字の形を認識しますが、元の画像に歪み、汚れ、滲み、かすれなどがあると正しい認識ができません。
また、イメージデータには文字だけでなく写真や線の情報なども含まれるので、それらを適確に判別できないと正しい認識ができません。

OCR で文字化けが発生する原因としては概ね以下のことが考えられます。

  1. 紙の原稿にかすれや汚れがある場合
  2. 文字の上に網掛けや線が重なったり、文字と文字の間隔が狭い場合
  3. スキャナで読み取る際に文字の解像度が低かったり、歪みがある場合
  4. 文字に傾きや装飾があったり、文字の字体が特殊である場合
  5. OCR 処理で文字領域、画像領域などのレイアウトを正しく判別できない場合

瞬簡PDF 変換 9』 の OCR 処理でも残念ながらの上記の1.~4.は対応が難しく、その場合は原稿の取り直しをしていただくか、変換結果を手作業で修正していただくことをお願いしております。
ただし、5.に関しては手作業ではありますが、変換前に誤認識を予防する手段として OCR 補正機能をご用意しています。
OCR補正機能

次回 は、この機能について詳しくご説明します。

—————————
「瞬簡PDF 変換 9」は体験版をご用意しております。
これにより、変換精度や使い勝手を事前にご確認いただくことができます。

体験版では以下のような制限がありますので、あらかじめご了承ください。

  • インストールしてから 15日を過ぎると利用できなくなります。
  • ひとつの PDF について、3ページまで変換可能です。
  • 評価以外の目的で日常業務に利用することはできません。

体験版に関する詳細は、『瞬簡PDF 変換 9 体験版のお申し込み』 をご参照ください。

OCRを使いこなそう…(2)>>


「PDF Tool API V6.0」新機能紹介

段々と涼しくなってきました。
秋になると紅葉を思い浮かべる方は多いと思いますが、これから咲く花もあります。職場の近くの散歩コースに四季桜があるのですが、ぼちぼち咲き始めています。これから満開になるのが楽しみです。冬の散歩は寒いですが…

現在、『PDF Tool API V6.0』の開発を行っています。
V6.0に搭載される機能を1つ紹介したいと思います。
その新しい機能というのは文字を検索してヒットしたらハイライト注釈でマークするというものです。下記は「美しい」という文字を検索して、ハイライト注釈でマークされたものです。

PDF Tool API

このPDFですが実は文字を書かれた順に取り出してみると「美うつくしい日本にほん」となっています。見た目と実際の文字の順番が違っている訳です。それ故、Adobe Reader で「美しい」を検索してもヒットしません。

『PDF Tool API V6.0』ではこのような場合でもヒットするようになっています。乞うご期待を。

● 製品詳細ページ
『Antenna House PDF Tool API 』

● PDF Tool API 説明書
『PDF Tool API V5.0 説明書 』


「ハッカソン」について

最近、一部エンジニアの間で「ハッカソン」という開発の競技が話題を呼んでいます。
そもそも皆さん、「ハッカソン」というワードを聞いたことがあるでしょうか?

ハッカソンとは、ハック(Hack)とマラソン(Marathon)の2つの英単語を繋いだ造語で、プログラマー、デザイナー、プランナー、ディレクター、マーケターが一丸となって、出題されたテーマに対して短期間でプロダクト、サービスを開発する競技イベントです。出来上がった成果物は、審査員によって評価され、評価された点数によって勝敗が決まります。

また、ハッカソンは、技術やアイディアの革新、投資の場として、新しいアイディア・サービスの提案と共有をすることを目的に実施されております。

ハッカソンの歴史は、まず言葉は、OpenBSDの開発者や、サン・マイクロシステムズのマーケティングチームによってそれぞれ自主的に考えだされたと思われ、1999年から使われ始めたと言われています。
OpenBSDは、1999年6月4日にカルガリーで行われた暗号開発イベントであり、アメリカ合衆国から10人の開発者が暗号ソフトウェアの輸出規制によって発生する法的問題をどうすれば回避できるかというテーマで参加し、サン・マイクロシステムズは、1999年6月15日から19日まで開催されたJavaOneカンファレンスで、出席者に新製品のPalm Vを使って他のPalmユーザーと赤外線通信やインターネットへ登録するためのプログラムをJavaで挑戦させたことが、始まりと言われております。
その後、2000年代半ばから後半にかけてハッカソンは、企業やベンチャーキャピタルから注目されるようになりました。
(歴史について Wikipediaより引用)

ハッカソンに出場する事でのメリットは数多く、とても大きいです。
以下のような内容が上げられます。

  • アイディアの提案、開発していく中で、新たな価値観を見つける事ができ、興味やスキルの幅が広がる。
  • 自身の持つスキルを見直す機会になる。
  • 他の出場者が作ったアイディア・プロダクトを見て、質問して知って、更に新しい刺激を受ける。
  • チーム出場の場合、チームメンバーの結束力の重要性を知る事ができる。
  • 他の業界、企業とのコネクションが広がる。大会中、懇親会がある場合は、尚更広がる。
  • イベントによっては、賞を取れば賞金、賞品が得られる。
  • 出場した事、開発したものを実績として残せる。大きい大会に出場して、賞を取っていれば尚更効果的。それらを履歴書に書いてみるのも良い。

特にチームメンバー全員で、成果物がしっかり出来上がった時の悦びは、何よりも大きいのと、普段の業務では全く味わえない楽しみ方ができるのが、ハッカソン楽しさであったりします。

しかし、メリットが大きいからといって、浮ついた下心を持っての参加は、避けて頂きたいです。
競技の出場者は、真剣に開発を行っている人ばかりで、競技を主催するスタッフの方たちも、情熱を注いで出場者達をバックアップして下さる方ばかりです。開発にも限られた時間があるため、事前に作戦に練って開発者とスタッフ、当日に臨機応変な対応して行動を起こす開発者とスタッフ。その日のために、何か掛けているものを持って競い合い、イベントの関わる全員の結束力があって、ハッカソンが成り立っています。

それでは、日本において有名なハッカソンを、簡単に3つご紹介します。
Yahoo! Hack Day https://hackday.jp/
Yahoo! Japan が主催する、24時間耐久でプロトタイプを開発し、90秒のプレゼンテーションで発表し合う、ハッカソンになります。
テーマは自由で、規約に反していなければ作りたいものを作って良く、また、子供向けの開発者部門もあります。

SPAJAM (スマートフォンアプリジャム) http://spajam.jp/
Moblie Content Forum が主催する、「温泉でハッカソン」を合言葉に、合言葉の通り温泉地を舞台に、出題されたテーマに沿ってスマートフォンアプリを開発して、イノベーションを起こし、出場者のスキルを向上するための競技と交流の場が設けられた、ハッカソンになります。

Mashup Awards http://mashupaward.jp/
多くの協賛パートナー企業が集って開催する、様々なデバイスやAPI、ハードウェア、技術をMashupし、さらに人や企業もMashupしながら、作品を生み出すことを楽しむ「ものづくりの祭典」イベントです。この中に、ハッカソンバトルの部門が存在し、2nd Stage, Final Stage, そして優勝を掛けて、競い合います。

他にもWebベンチャー企業主催の「ラーメン二郎」をテーマにしたジロッカソンといった、コアなハッカソンなども存在します。

ハッカソンは、出場者にとって自身の何かを変えてくれる場です。
もし興味があれば、一歩踏み出して出場してみては、いかがでしょうか。


Pages: 1 2 3 4 5 6 7 8 9 10 ... 158 159 160 Next