カテゴリー別アーカイブ: 製品ナビゲータ

TextPorter におまかせ その2

■ 社内の文書ファイルをアーカイブとして利用したいのですが、どうすればよいでしょうか?

とある展示会場で、弊社ブース前でチラシを手に取る来場客に「お声掛け」をした際の返答でした。

「検索システムを作成してはどうですか。うちでは扱っていませんが・・・・」
えーっと、これでは話が終わってしまう。無理矢理こちらの土俵に引き込まなくては。

「データを XML 化すればですね、検索結果を web で閲覧できるし、任意のレイアウトで組版して再配布も・・・・」
いかん、「XML」と「組版」の時点で遠い目になってしまっている。

「XML 構造の設計と XSLT の開発は当方で請負いますが、タグ付けの作業は・・・」
逆効果じゃないか、非日常空間から呼び戻さなくては。

「そのためには、テキストの抽出が必要になります。」
お、やっと言葉が通じたか。

「文書ファイルからテキスト情報を抽出する機能は,検索システムや文書管理システムには必須機能です。TextPorter は、さまざまなアプリケーションのファイルからテキストを抽出する、サーバ組込用テキスト抽出エンジンです。」
突然、カタログ的説明口調になっている。

「TextPorter で文書からテキストを抽出して、全文検索システムで検索できるようにしておくことで、目的の文書をすばやく探し出せます。」
XML の件は無かったことにしました。

『TextPorter にお任せください!!』

その後、この話がどう展開したか。それは、また別のお話し。

「TextPorter」 は、次のようなシステム、または汎用製品に組み込まれており採用実績があります。

  • 文書管理ソフトウェア製品に組み込み
  • 全文検索エンジンと共にグループウェアに組み込み
  • 企業内文書管理システムに組み込み
  • 電子メール・サーバ製品に組み込み
  • インターネット情報検索アプリケーションに組み込み
  • イントラネット・テキスト・マイニング・サーバに組み込み
  • セキュリティ管理製品に組み込み

Microsoft Office, PDF など主要なアプリケーション・ファイルを識別し、作成したアプリケーションがなくても、ファイルからテキストを抽出可能です。
しかも、ファイルの拡張子ではなく、ファイル内部の情報に基づいて識別しますので、正確な判別が可能となります。

対応しているファイル形式は、 「抽出対象ファイル形式」https://www.antenna.co.jp/axx/function02.html
をご覧ください。

「TextPorter」に関する詳しい情報は、製品ページ
https://www.antenna.co.jp/axx/
を、ぜひ、ご覧ください。

評価版もご用意しています。
評価版のお申し込み
https://www.antenna.co.jp/axx/trial.html
から、お申し込みください。

<< TextPorter におまかせ その1           TextPorter におまかせ その3 >>




瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識


瞬簡PDF 作成 2024
ドラッグ&ドロップでPDF作成

TextPorter におまかせ その1

■ 様々な文書ファイルからテキスト部分を抽出できる製品はありますか?

重要文書が突然消えたかと思うとひょっこり現れたりと、ドキュメントの「神隠し」が横行しているからというわけではないでしょうが、紙文書の電子化で業務の効率化と省スペース化するサービス、まだまだ需要は尽きないようです。

「今頃紙の電子化なんて」と思われた方、文書が全て電子化できているからと安心してはいませんか。
では、過去に作成された大量のドキュメント・ファイル、どのように活用していますか。
多種多様なアプリケーション、異なるバージョンでファイル形式の百花繚乱!
いざドキュメントを開こうとしてもアプリが見つからず、サーバの中で塩漬けになっていては、紙文書を倉庫に積み上げているのと変わりません。

~ドキュメント、役に立たなきゃただのゴミ~

  1. 各種アプリケーションのデータを、編集可能な形式にコンバート
  2. 各種アプリケーションのデータを、一括でPDFや画像に変換
  3. PDFから各種アプリケーションソフトのデータにコンバート

レガシーデータの再利用には様々な方法があります。
いずれの場合も、アンテナハウスの製品を利用すれば簡単に実現できますが、今回は書面の再現・再利用ではなく、ドキュメントからテキストを抽出する方法をご提案します。

体裁ではなく中身(テキスト)が重要!
データベース化し、手軽に検索して閲覧するのが目的ならば、大量のファイルから高速にテキストを抽出できる方法が鍵になりますね。
しかし、多種多様なファイル形式とバージョンが混在していて、ファイル形式別に仕分けするのは至難の業・・・

『TextPorter にお任せください!!』

「TextPorter」 は、さまざまなアプリケーションのファイルからテキストを抽出する、クラウドコンピューティング時代のサーバ組込用テキスト抽出エンジンです。
Microsoft Office, PDF など主要なアプリケーション・ファイルを識別し、作成したアプリケーションがなくても、ファイルからテキストを抽出可能です。
しかも、ファイルの拡張子ではなく、ファイル内部の情報に基づいて識別しますので、正確な判別が可能となります。
対応しているファイル形式は、 「抽出対象ファイル形式」 をご覧ください。昔懐かしい(年代が知れます)各種ワープロ文書にも対応しています。

「TextPorter」 は、対応ファイルの多さなどが評価され、ウェブサービス、パブリッククラウド、プライベートクラウドなどで、検索エンジン、ウイルス対策ソフト、企業機密の漏洩を防ぐソフトなどに利用されています。

「TextPorter」 に関する詳しい情報は、製品ページ
https://www.antenna.co.jp/axx/
を、ぜひ、ご覧ください。

評価版もご用意しています。
評価版のお申し込み
https://www.antenna.co.jp/axx/trial.html
から、お申し込みください。

TextPorter におまかせ その2 >>




瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識


アウトライナー
PDFを解析して しおり・目次を自動生成

Office Server Document Converter(Server Based Converter含む) 及び TextPorter のメンテナンスリリースについて

Office Server Document Converter(Server Based Converter 含む)及び TextPorter のメンテナンスリリースについて紹介させていただきます。
各製品をお使いのお客様で、弊社と保守契約を結んでいらっしゃるお客様には、バグ修正を行ったメンテナンスリリース (MR) を配布しております。

ご提供間隔としては、

  •  最新版につきましては、おおよそ4ヵ月に1回、年3回を目安とした配布
  •  最新版以外のバージョンにつきましては、バグ修正の状況に合わせ、おおよそ半年または1年に1回を目安とした配布

としております。何卒、ご活用ください。

<Office Server Document Converter(Server Based Converter 含む)>

2018/3/12 に Office Server Document Converter V6.1 MR2 と Server Based Converter V6.0 MR5 をリリースいたしました。旧バージョン(SBC5.2MR10、V5.0MR11、V4.0MR12)は、3/19から3/27順次リリースいたしました。
なお、V4.0はMR12が最終版となります。

改定情報は、以下をご参照ください。

■ 次回改訂版リリース予定
2018/7/10にOffice Server Document Converter V6.1 MR3 と Server Based Converter V6.0 MR6をリリースいたします。
旧バージョンの改訂版は、年末リリースを予定しています。

各バージョンの保守期限に関しては、保守期限のページ にてご確認ください。

Office Server Document Converter(Server Based Converter 含む)は、Microsoft Office, PDF などのファイルを、PDF, Flash, SVG, 各種画像形式にダイレクトに変換する変換エンジンです。 ダイレクト変換の意味は、たとえば、Microsoft Office がない環境でも、ファイルさえあれば、それをダイレクトに内容を見える形式に変換できるのです。ダイレクト変換には、Microsoft Office のライセンスも不要です。
Office Server Document Converter(Server Based Converter含む)は、ダイレクト変換というユニークさが評価され、多くのウェブサービス、パブリッククラウド、プライベートクラウドなどで利用されています。

OSDCに関する詳しい情報は、製品ページ
https://www.antenna.co.jp/sbc/
を、ぜひ、ご覧ください。

評価版もご用意しております。
評価版のお申し込み
https://www.antenna.co.jp/sbc/trial.html
から、お申し込みください。

<TextPorter>

■ 次回改訂版リリース予定
2018年6月中に V5.4MR4 のリリースを予定しております。
前回(V5.4MR3)までの改訂内容に関しては、こちら をご参照ください。TextPorter は、サーバ組込用のテキスト抽出エンジンです。Microsoft Office, PDF など様々なアプリケーションのファイルから文字列を抜き出します。
TextPorter は、対応ファイルの多さなどが評価され、ウェブサービス、パブリッククラウド、プライベートクラウドなどで、検索エンジン、ウイルス対策ソフト、企業機密の漏洩を防ぐソフトなどに利用されています。

TextPorterに関する詳しい情報は、製品ページ
https://www.antenna.co.jp/axx/
を、ぜひ、ご覧ください。

評価版もご用意しております。
評価版のお申し込み
https://www.antenna.co.jp/axx/trial.html
から、お申し込みください。

◎「製品ナビゲータ」好評公開中!
お客様が「やりたいこと」「したいこと」から弊社のシステムコンポーネント製品を探していただく「製品ナビゲータ」を設置しました。計画中のプロジェクトにマッチした製品をお探しならば、是非ともページ上部のバナーをクリックして下さい。
もし該当する製品が無かった場合は、お気軽に弊社システム 営業グループ宛 (sis@antenna.co.jp) にお問い合わせ下さい。




アウトライナー
PDFを解析して しおり・目次を自動生成


瞬簡PDF 作成 2024
ドラッグ&ドロップでPDF作成

PDF の組み込み用 SDK『Antenna House PDF Viewer SDK V3.5』

弊社では、独自の PDF リーダーの開発に利用できる Windows 向けの SDK を販売しております。

PDF の表示以外にも、印刷用途、指定範囲のテキスト抽出、注釈の操作、ページ操作、画像保存をおこなうことができます。

PDF の画像保存は、Office Server Document Converter というサーバサイドで変換するサーバ用のライブラリがございますが、クライアントアプリケーションで画像化する場合は、PDF Viewer SDK を使用いただいております。

また、PDF 内の特定領域の情報を取得したいといった用途でも利用可能です。

この場合は、PDF Viewer SDK と、PDF Tool API  を組み合わせて実現可能です。
特定領域の座標値を PDF Viewer SDKで取得して、その情報を PDF Tool API に渡して処理します。

弊社では、ご使用になるソリューションによって最適なライブラリ、組み合わせをご提案させていただいております。

PDF の活用に関しては、製品ナビゲータ  を公開しております。
こちらに掲載が無い活用方法などございましたら弊社までお気軽にご相談ください。




瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品!


瞬簡PDF 作成 2024
ドラッグ&ドロップでPDF作成

「PDF CookBook」と「製品ナビゲータ」

S1 営業グループでは、今年に入り新しい事をいくつか始めております。
そちらをご紹介いたします。

1.「製品ナビゲータ」のご紹介

製品ナビゲータは、今までにいただいた弊社製品、及びその利用方法へのお問い合わせをQ&A 方式で公開しております。特に多いのが、PDF を利用する際のお問い合わせです。PDF に関しては、既に作成するためだけでなく、「既存の PDF を如何に利用するか」がメインテーマとなってきています。弊社では、主に自社製の PDF 関連ライブラリーを多数所有しておりますので、その組み合わせで色々なご要望にお答えできます。
是非、ご一読ください。

2.「PDF CookBook」のご紹介

前項に関連して、PDF の利用方法を料理方法に見立て、様々な問題を具体的に解決するための指南本です。既に第一巻が出版され弊社オンラインショップやアマゾン等で販売されております。
掲載内容は、大きく分けますと「第1章 PDF 文書のページ」「第2章 PDF 文書の本文描画」となっており、それぞれの章で PDF の加工や編集に関する内容を Java プログラムのサンプル付きで説明しております。中身は、プログラマーのみならず、営業や企画担当者でも咀嚼しやすい内容となっております。きっと、エンドユーザ様へのご提案にもお役立ちするものと思っております。
また、2018年 5月 9日から開催される「第 27 回ソフトウェア&アプリ開発展」(通称 SODEC)で弊社ブースへお越しいただきお名刺の交換をしていただければ「PDF CookBook 簡易版」をご提供いたします。

以上です。

今回ご紹介したコンテンツ以外にも、様々なコンテンツを準備しています。
ご期待下さい!




HTML on Word
WebページをWordで作る!


瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識

Office Server Document Converter (OSDC) におまかせ その4

■ Office Server Document Converter (OSDC) を使って「やりたいこと」は何ですか?

「Office Server Document Converter (OSDC) におまかせ」 その1 から その3 は、お客様の質問に答えるかたちで進めてきました。
ご存知のように、OSDC は気軽にお試しいただけるよう「評価版」 を用意しています。
お申込みの際に、簡単なアンケートにご協力をいただいており、その中で「評価目的」もお尋ねしています。

今回はそのアンケート結果から、お客様が OSDC で何をしたいのか、何を期待しているのかを探ってみたいと思います。

その前に一つ、「評価目的」と問われて皆さんは何を思いますか。
ちょっと曖昧な質問に対して、「OSDC で実行したいこと」と「評価版で検証したいこと」の 2 種類の回答が寄せられています。
実はどちらも知りたいことなので結果として問題は無いのですが、設問として曖昧さはどうなのか、しかし似たような設問を 2 個作るのも心苦しいなどと思いつつ、当面はこのママとさせていただきます。

・Microsoft Office ファイルを PDF へ変換

「OSDC で実行したいこと」系の回答をいただいた方の約半数がこれをあげており、中には「Linux 環境」「サーバサイドオートメーション以外」と明記いただいている方もいます。OSDC のダイレクト変換への期待を感じます。
Microsoft Office ファイルから各種画像ファイルや SWF 形式への変換もあがっていて、オフィス文書は Microsoft Office の独壇場であることが良くわかります。

・PDF ファイルを変換、PDF ファイルへ変換

「OSDC で実行したいこと」系の回答では、PDF ファイルからの変換が続きます。変換先は各種画像や SVG 形式です。
単に「PDF 変換」と回答されている方も多く、これは元データが画像ファイルなのか Office なのか不明ですが、多種にわたる出力形式・入力形式に対応している OSDC の特長ともいえるとともに、閲覧用としての PDF の普及度も見えてきます。

・変換精度

「評価版で検証したいこと」系の回答で断トツが、やはりこれです。評価版をダウンロードした方の 4 分の 1 が回答しています。
まあ、変換精度については必ず検証をして下さいと再三に渡りお伝えして、その為に評価版をお使いになることを推奨しているので、喜ばしい結果ともいえますが。
「罫線の表示確認」などとピンポイントで攻めてくる方もいて、よく製品の特性をご存知のようで、粗探しではなく期待の表れと受け取らせていただきます。

・処理速度

「評価版で検証したいこと」系の 2 番目です。変換精度とは「ダイレクト変換」の裏表の関係となります。変換精度に比べると半数以下ですが、お試しいただければ実感できるところなので、大量なデータ処理を行う際は検証項目に加えていただくことをお薦めします。

さて、これらの元になりましたアンケート結果は、公開することを前提としていないため、残念ながらお見せすることはできません。
ほんの一部だけですが、ご紹介した内容が皆様の製品選定に役立てばと思います。

ソフトウエアは使ってみなければわかりません。
評価版でじっくり検証し、運用の環境や目的をよくご検討いただいたうえで、
「Office Server Document Converter(OSDC) にお任せください!」

Office Server Document Converter に関する詳しい情報は、
Office Server Document Converter を、ご覧ください。

この度、お客様が「やりたいこと」「したいこと」から弊社のシステムコンポーネント製品を探していただく「製品ナビゲータ」を設置しました。
計画中のプロジェクトにマッチした製品をお探しならば、是非ともページ上部のバナーをクリックして下さい。
もし該当する製品が無かった場合は、お気軽に 弊社システム営業グループ 宛にお問い合わせ下さい。

<< OSDC におまかせ   その1 その2 その3




瞬簡PDF 作成 2024
ドラッグ&ドロップでPDF作成


アウトライナー
PDFを解析して しおり・目次を自動生成

Office Server Document Converter (OSDC) におまかせ その3

■ Office Server Document Converter (OSDC) の「ダイレクト変換方式」とは何ですか?

お世話になっていますと言いながら、 Office Server Document Converter (OSDC) に Microsoft Office は不要です、と 2 回に渡って書いてきましたが、これを実現しているのが「ダイレクト変換方式」です。

ドキュメントの作成元のアプリケーションを使用せず、また、プリンタドライバも使用しないで、独自の変換エンジンでファイルを解析してダイレクトに変換するため、「ダイレクト変換方式」と呼んでいます。
前回 も触れましたが、「Microsoft Office のオートメーション」をサーバーサイドで使用する必要が無いため、Microsoft Office がインストールされていない環境、動作しない環境でも、Office ファイルを読み込み各種ファイル形式への変換が可能になるのです。

「ダイレクト変換方式」の特長を挙げさせていただくと、

  • 高速変換
    一般的な Microsoft Office を起動して、プリンタドライバで印刷するように PDF を作成する方式に比べると、「ダイレクト変換」ですので高速なファイル変換が可能です。
  • ドキュメント内の悪意のあるスクリプトを無視
    Microsoft Office を起動して PDF を作成する方式では、悪意のあるスクリプトが実行される可能性があります。Office アプリ側でスクリプトを禁止するなどの対策が必要となりますが、OSDC の「ダイレクト変換」では独自に Office ファイルを読んで PDF に変換するので、スクリプトが実行されることがありません。

と、ドヤ顔で自慢話をしていますが、何にでも残念な面の一つはあるものです。

  • レイアウトの再現性
    OSDC は独自のエンジンでファイルを解析して元のレイアウトに似せて変換しています。元のアプリケーションは使用しておりませんので、どうしてもレイアウトのズレが発生してしまいます。これは、ファイル形式、レイアウトの複雑さによって一定ではありません。

そのため、評価版をご利用になって、実際に変換対象となるドキュメントで検証いただくことをお薦め致します。
評価版のお申し込み から、お申し込みください。

また、自際の変換結果の比較については、「Office Server Document Converter 変換精度」に掲載していますので、ご参照ください。

運用の環境や目的をよくご検討いただいたうえで、やっぱり
「Office Server Document Converter(OSDC) にお任せください!」

Office Server Document Converter に関する詳しい情報は、
Office Server Document Converter を、ご覧ください。

この度、お客様が「やりたいこと」「したいこと」から弊社のシステムコンポーネント製品を探していただく「製品ナビゲータ」を設置しました。
計画中のプロジェクトにマッチした製品をお探しならば、是非ともページ上部のバナーをクリックして下さい。
もし該当する製品が無かった場合は、お気軽に 弊社システム営業グループ 宛にお問い合わせ下さい。

OSDC におまかせ その4 >>




HTML on Word
WebページをWordで作る!


瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品!

Office Server Document Converter (OSDC) におまかせ その1

■ Linux 環境で Microsoft Office 文書を PDF に変換できますか?

Microsoft Office、日々お世話になっています。
好むと好まざるとに関わらず、今や文書作成には欠かせない必須アイテムです。
企業や官公庁では、膨大な数の文書が、Microsoft Office を使用して作成されていますが、この保管や閲覧が大変ではありませんか。
「ペーパーレス」が叫ばれて幾年月、今更紙に印刷は無いとは思いますが、これらの文書をそのまま電子文書としてファイリングするにしても、お手軽に文書が作成できるようになった分、様々なソフトとバージョンが入り乱れて、閲覧側のインストール環境の違いで閲覧できないという事態が発生しているのでは。
そこで、これらの文書を共通のファイル形式(PDF、画像)に変換して管理する文書管理システムが各社で作られています。

これでめでたしめでたしとなれば良いのですが、サーバ環境も千差万別、サーバライセンスの購入費用や公共性のためオープンソースに限るなど予算の都合や大人の事情も加わって、なかなか軟着陸とはいかない場合も。

そうして寄せられたのが、冒頭のお問い合わせです。
「Linux 環境でMicrosoft Office 文書を PDF に変換できますか?」
「サーバに Office 互換製品 (OpenOffice/LibreOffice等) の導入は必要なのでしょうか?」

「Office Server Document Converter(OSDC) にお任せください!」

  • OSDC で対応可能です。
  • Microsoft Office ファイルからの変換に関しては、OSDC 以外必要ありません。
  • PDF への変換の他、画像ファイルへも変換できます。

Office Server Document Converter に関する詳しい情報は、
Office Server Document Converter を、ご覧ください。

評価版もご用意しております。
Office Server Document Converter 評価版のお申し込み
から、お申し込みください。

この度、お客様が「やりたいこと」「したいこと」から弊社のシステムコンポーネント製品を探していただく「製品ナビゲータ」を設置しました。
計画中のプロジェクトにマッチした製品をお探しならば、是非ともページ上部のバナーをクリックして下さい。
もし該当する製品が無かった場合は、お気軽に 弊社システム営業グループ 宛にお問い合わせ下さい。

OSDC におまかせ その2 >>




HTML on Word
WebページをWordで作る!


瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識
Pages: Prev 1 2