■ 社内の文書ファイルをアーカイブとして利用したいのですが、どうすればよいでしょうか?
とある展示会場で、弊社ブース前でチラシを手に取る来場客に「お声掛け」をした際の返答でした。
「検索システムを作成してはどうですか。うちでは扱っていませんが・・・・」
えーっと、これでは話が終わってしまう。無理矢理こちらの土俵に引き込まなくては。
「データを XML 化すればですね、検索結果を web で閲覧できるし、任意のレイアウトで組版して再配布も・・・・」
いかん、「XML」と「組版」の時点で遠い目になってしまっている。
「XML 構造の設計と XSLT の開発は当方で請負いますが、タグ付けの作業は・・・」
逆効果じゃないか、非日常空間から呼び戻さなくては。
「そのためには、テキストの抽出が必要になります。」
お、やっと言葉が通じたか。
「文書ファイルからテキスト情報を抽出する機能は,検索システムや文書管理システムには必須機能です。TextPorter は、さまざまなアプリケーションのファイルからテキストを抽出する、サーバ組込用テキスト抽出エンジンです。」
突然、カタログ的説明口調になっている。
「TextPorter で文書からテキストを抽出して、全文検索システムで検索できるようにしておくことで、目的の文書をすばやく探し出せます。」
XML の件は無かったことにしました。
『TextPorter にお任せください!!』
その後、この話がどう展開したか。それは、また別のお話し。
「TextPorter」 は、次のようなシステム、または汎用製品に組み込まれており採用実績があります。
- 文書管理ソフトウェア製品に組み込み
- 全文検索エンジンと共にグループウェアに組み込み
- 企業内文書管理システムに組み込み
- 電子メール・サーバ製品に組み込み
- インターネット情報検索アプリケーションに組み込み
- イントラネット・テキスト・マイニング・サーバに組み込み
- セキュリティ管理製品に組み込み
Microsoft Office, PDF など主要なアプリケーション・ファイルを識別し、作成したアプリケーションがなくても、ファイルからテキストを抽出可能です。
しかも、ファイルの拡張子ではなく、ファイル内部の情報に基づいて識別しますので、正確な判別が可能となります。
対応しているファイル形式は、 「抽出対象ファイル形式」https://www.antenna.co.jp/axx/function02.html
をご覧ください。
「TextPorter」に関する詳しい情報は、製品ページ
https://www.antenna.co.jp/axx/
を、ぜひ、ご覧ください。
評価版もご用意しています。
評価版のお申し込み
https://www.antenna.co.jp/axx/trial.html
から、お申し込みください。
<< TextPorter におまかせ その1 TextPorter におまかせ その3 >>