タグ別アーカイブ: Linux環境

TextPorter におまかせ その3

■ 全文検索の結果はテキスト情報だけではなく、元の文書も閲覧したいのですが、ファイル形式がバラバラでして。

『TextPorter』 は、さまざまなアプリケーションのファイルから、作成したアプリケーションがなくてもテキストを抽出することができます。
その抽出したテキストを、全文検索システムで検索できるようにしておくことで、目的の文書をすばやく探し出せるのです。

と、ドヤ顔で言ってはみましたが、確かに作成されている文書はテキスト情報だけではありません。挿絵の画像やグラフ・表は、文書の附帯情報として必須のものです。
やはり元の情報を過不足無く閲覧できるのがベストですね。
(次第に声が小さくなっていく)

テキスト以外の情報を切り出して再配置する。できないことはありませんが、手間が掛かる。
元ファイルをそのままリンクしても、各アプリケーションが無いと開けません。
ファイルを丸ごと画像や PDF に変換するにしても、やはり作成元のアプリケーションが必要。
アプリケーションに依存せずにテキストを抽出したのだから、閲覧ファイルも同じように作れたら・・・

「となると、やっぱり あれ の出番ですね」

『Office Server Document Converter(OSDC) にお任せください!』

Office Server Document Converter は、作成元のアプリケーションもプリンタドライバも必要とせずにドキュメントを変換できます。

Office Server Document Converter によって、文書からサムネイル画像を生成することで、全文検索システムで検索した文書の見分けも簡単にできるようになります。
目的の文書をすばやく探し出して、そのサムネイルをみて、実際の文書を引っ張り出せるようにするわけです。
また、検索結果と PDF をリンクすることで、元の文書の情報を過不足無く閲覧することができます。

システムのイメージは、
Office Server Document Converter 活用例にある
サムネイルサーバ
を発展させたものです。

『アンテナハウス にお任せください!』

Office Server Document Converter に関する詳しい情報は、
http://www.antenna.co.jp/sbc/
を、ご覧ください。

評価版もご用意しております。
Office Server Document Converter 評価版のお申し込み
から、お申し込みください。

<< TextPorter におまかせ その2


TextPorter におまかせ その1

■ 様々な文書ファイルからテキスト部分を抽出できる製品はありますか?

重要文書が突然消えたかと思うとひょっこり現れたりと、ドキュメントの「神隠し」が横行しているからというわけではないでしょうが、紙文書の電子化で業務の効率化と省スペース化するサービス、まだまだ需要は尽きないようです。

「今頃紙の電子化なんて」と思われた方、文書が全て電子化できているからと安心してはいませんか。
では、過去に作成された大量のドキュメント・ファイル、どのように活用していますか。
多種多様なアプリケーション、異なるバージョンでファイル形式の百花繚乱!
いざドキュメントを開こうとしてもアプリが見つからず、サーバの中で塩漬けになっていては、紙文書を倉庫に積み上げているのと変わりません。

~ドキュメント、役に立たなきゃただのゴミ~

  1. 各種アプリケーションのデータを、編集可能な形式にコンバート
  2. 各種アプリケーションのデータを、一括でPDFや画像に変換
  3. PDFから各種アプリケーションソフトのデータにコンバート

レガシーデータの再利用には様々な方法があります。
いずれの場合も、アンテナハウスの製品を利用すれば簡単に実現できますが、今回は書面の再現・再利用ではなく、ドキュメントからテキストを抽出する方法をご提案します。

体裁ではなく中身(テキスト)が重要!
データベース化し、手軽に検索して閲覧するのが目的ならば、大量のファイルから高速にテキストを抽出できる方法が鍵になりますね。
しかし、多種多様なファイル形式とバージョンが混在していて、ファイル形式別に仕分けするのは至難の業・・・

『TextPorter にお任せください!!』

「TextPorter」 は、さまざまなアプリケーションのファイルからテキストを抽出する、クラウドコンピューティング時代のサーバ組込用テキスト抽出エンジンです。
Microsoft Office, PDF など主要なアプリケーション・ファイルを識別し、作成したアプリケーションがなくても、ファイルからテキストを抽出可能です。
しかも、ファイルの拡張子ではなく、ファイル内部の情報に基づいて識別しますので、正確な判別が可能となります。
対応しているファイル形式は、 「抽出対象ファイル形式」 をご覧ください。昔懐かしい(年代が知れます)各種ワープロ文書にも対応しています。

「TextPorter」 は、対応ファイルの多さなどが評価され、ウェブサービス、パブリッククラウド、プライベートクラウドなどで、検索エンジン、ウイルス対策ソフト、企業機密の漏洩を防ぐソフトなどに利用されています。

「TextPorter」 に関する詳しい情報は、製品ページ
http://www.antenna.co.jp/axx/
を、ぜひ、ご覧ください。

評価版もご用意しています。
評価版のお申し込み
http://www.antenna.co.jp/axx/trial.html
から、お申し込みください。

TextPorter におまかせ その2 >>


Office Server Document Converter(Server Based Converter含む) 及び TextPorter のメンテナンスリリースについて

Office Server Document Converter(Server Based Converter 含む)及び TextPorter のメンテナンスリリースについて紹介させていただきます。
各製品をお使いのお客様で、弊社と保守契約を結んでいらっしゃるお客様には、バグ修正を行ったメンテナンスリリース (MR) を配布しております。

ご提供間隔としては、

  •  最新版につきましては、おおよそ4ヵ月に1回、年3回を目安とした配布
  •  最新版以外のバージョンにつきましては、バグ修正の状況に合わせ、おおよそ半年または1年に1回を目安とした配布

としております。何卒、ご活用ください。

<Office Server Document Converter(Server Based Converter 含む)>

2018/3/12 に Office Server Document Converter V6.1 MR2 と Server Based Converter V6.0 MR5 をリリースいたしました。旧バージョン(SBC5.2MR10、V5.0MR11、V4.0MR12)は、3/19から3/27順次リリースいたしました。
なお、V4.0はMR12が最終版となります。

改定情報は、以下をご参照ください。

■ 次回改訂版リリース予定
2018/7/10にOffice Server Document Converter V6.1 MR3 と Server Based Converter V6.0 MR6をリリースいたします。
旧バージョンの改訂版は、年末リリースを予定しています。

各バージョンの保守期限に関しては、保守期限のページ にてご確認ください。

Office Server Document Converter(Server Based Converter 含む)は、Microsoft Office, PDF などのファイルを、PDF, Flash, SVG, 各種画像形式にダイレクトに変換する変換エンジンです。 ダイレクト変換の意味は、たとえば、Microsoft Office がない環境でも、ファイルさえあれば、それをダイレクトに内容を見える形式に変換できるのです。ダイレクト変換には、Microsoft Office のライセンスも不要です。
Office Server Document Converter(Server Based Converter含む)は、ダイレクト変換というユニークさが評価され、多くのウェブサービス、パブリッククラウド、プライベートクラウドなどで利用されています。

OSDCに関する詳しい情報は、製品ページ
http://www.antenna.co.jp/sbc/
を、ぜひ、ご覧ください。

評価版もご用意しております。
評価版のお申し込み
http://www.antenna.co.jp/sbc/trial.html
から、お申し込みください。

<TextPorter>

■ 次回改訂版リリース予定
2018年6月中に V5.4MR4 のリリースを予定しております。
前回(V5.4MR3)までの改訂内容に関しては、こちら をご参照ください。TextPorter は、サーバ組込用のテキスト抽出エンジンです。Microsoft Office, PDF など様々なアプリケーションのファイルから文字列を抜き出します。
TextPorter は、対応ファイルの多さなどが評価され、ウェブサービス、パブリッククラウド、プライベートクラウドなどで、検索エンジン、ウイルス対策ソフト、企業機密の漏洩を防ぐソフトなどに利用されています。

TextPorterに関する詳しい情報は、製品ページ
http://www.antenna.co.jp/axx/
を、ぜひ、ご覧ください。

評価版もご用意しております。
評価版のお申し込み
http://www.antenna.co.jp/axx/trial.html
から、お申し込みください。

◎「製品ナビゲータ」好評公開中!
お客様が「やりたいこと」「したいこと」から弊社のシステムコンポーネント製品を探していただく「製品ナビゲータ」を設置しました。計画中のプロジェクトにマッチした製品をお探しならば、是非ともページ上部のバナーをクリックして下さい。
もし該当する製品が無かった場合は、お気軽に弊社システム 営業グループ宛 (sis@antenna.co.jp) にお問い合わせ下さい。


Office Server Document Converter (OSDC) におまかせ その4

■ Office Server Document Converter (OSDC) を使って「やりたいこと」は何ですか?

「Office Server Document Converter (OSDC) におまかせ」 その1 から その3 は、お客様の質問に答えるかたちで進めてきました。
ご存知のように、OSDC は気軽にお試しいただけるよう「評価版」 を用意しています。
お申込みの際に、簡単なアンケートにご協力をいただいており、その中で「評価目的」もお尋ねしています。

今回はそのアンケート結果から、お客様が OSDC で何をしたいのか、何を期待しているのかを探ってみたいと思います。

その前に一つ、「評価目的」と問われて皆さんは何を思いますか。
ちょっと曖昧な質問に対して、「OSDC で実行したいこと」と「評価版で検証したいこと」の 2 種類の回答が寄せられています。
実はどちらも知りたいことなので結果として問題は無いのですが、設問として曖昧さはどうなのか、しかし似たような設問を 2 個作るのも心苦しいなどと思いつつ、当面はこのママとさせていただきます。

・Microsoft Office ファイルを PDF へ変換

「OSDC で実行したいこと」系の回答をいただいた方の約半数がこれをあげており、中には「Linux 環境」「サーバサイドオートメーション以外」と明記いただいている方もいます。OSDC のダイレクト変換への期待を感じます。
Microsoft Office ファイルから各種画像ファイルや SWF 形式への変換もあがっていて、オフィス文書は Microsoft Office の独壇場であることが良くわかります。

・PDF ファイルを変換、PDF ファイルへ変換

「OSDC で実行したいこと」系の回答では、PDF ファイルからの変換が続きます。変換先は各種画像や SVG 形式です。
単に「PDF 変換」と回答されている方も多く、これは元データが画像ファイルなのか Office なのか不明ですが、多種にわたる出力形式・入力形式に対応している OSDC の特長ともいえるとともに、閲覧用としての PDF の普及度も見えてきます。

・変換精度

「評価版で検証したいこと」系の回答で断トツが、やはりこれです。評価版をダウンロードした方の 4 分の 1 が回答しています。
まあ、変換精度については必ず検証をして下さいと再三に渡りお伝えして、その為に評価版をお使いになることを推奨しているので、喜ばしい結果ともいえますが。
「罫線の表示確認」などとピンポイントで攻めてくる方もいて、よく製品の特性をご存知のようで、粗探しではなく期待の表れと受け取らせていただきます。

・処理速度

「評価版で検証したいこと」系の 2 番目です。変換精度とは「ダイレクト変換」の裏表の関係となります。変換精度に比べると半数以下ですが、お試しいただければ実感できるところなので、大量なデータ処理を行う際は検証項目に加えていただくことをお薦めします。

さて、これらの元になりましたアンケート結果は、公開することを前提としていないため、残念ながらお見せすることはできません。
ほんの一部だけですが、ご紹介した内容が皆様の製品選定に役立てばと思います。

ソフトウエアは使ってみなければわかりません。
評価版でじっくり検証し、運用の環境や目的をよくご検討いただいたうえで、
「Office Server Document Converter(OSDC) にお任せください!」

Office Server Document Converter に関する詳しい情報は、
Office Server Document Converter を、ご覧ください。

この度、お客様が「やりたいこと」「したいこと」から弊社のシステムコンポーネント製品を探していただく「製品ナビゲータ」を設置しました。
計画中のプロジェクトにマッチした製品をお探しならば、是非ともページ上部のバナーをクリックして下さい。
もし該当する製品が無かった場合は、お気軽に 弊社システム営業グループ 宛にお問い合わせ下さい。

<< OSDC におまかせ   その1 その2 その3


Office Server Document Converter (OSDC) におまかせ その3

■ Office Server Document Converter (OSDC) の「ダイレクト変換方式」とは何ですか?

お世話になっていますと言いながら、 Office Server Document Converter (OSDC) に Microsoft Office は不要です、と 2 回に渡って書いてきましたが、これを実現しているのが「ダイレクト変換方式」です。

ドキュメントの作成元のアプリケーションを使用せず、また、プリンタドライバも使用しないで、独自の変換エンジンでファイルを解析してダイレクトに変換するため、「ダイレクト変換方式」と呼んでいます。
前回 も触れましたが、「Microsoft Office のオートメーション」をサーバーサイドで使用する必要が無いため、Microsoft Office がインストールされていない環境、動作しない環境でも、Office ファイルを読み込み各種ファイル形式への変換が可能になるのです。

「ダイレクト変換方式」の特長を挙げさせていただくと、

  • 高速変換
    一般的な Microsoft Office を起動して、プリンタドライバで印刷するように PDF を作成する方式に比べると、「ダイレクト変換」ですので高速なファイル変換が可能です。
  • ドキュメント内の悪意のあるスクリプトを無視
    Microsoft Office を起動して PDF を作成する方式では、悪意のあるスクリプトが実行される可能性があります。Office アプリ側でスクリプトを禁止するなどの対策が必要となりますが、OSDC の「ダイレクト変換」では独自に Office ファイルを読んで PDF に変換するので、スクリプトが実行されることがありません。

と、ドヤ顔で自慢話をしていますが、何にでも残念な面の一つはあるものです。

  • レイアウトの再現性
    OSDC は独自のエンジンでファイルを解析して元のレイアウトに似せて変換しています。元のアプリケーションは使用しておりませんので、どうしてもレイアウトのズレが発生してしまいます。これは、ファイル形式、レイアウトの複雑さによって一定ではありません。

そのため、評価版をご利用になって、実際に変換対象となるドキュメントで検証いただくことをお薦め致します。
評価版のお申し込み から、お申し込みください。

また、自際の変換結果の比較については、「Office Server Document Converter 変換精度」に掲載していますので、ご参照ください。

運用の環境や目的をよくご検討いただいたうえで、やっぱり
「Office Server Document Converter(OSDC) にお任せください!」

Office Server Document Converter に関する詳しい情報は、
Office Server Document Converter を、ご覧ください。

この度、お客様が「やりたいこと」「したいこと」から弊社のシステムコンポーネント製品を探していただく「製品ナビゲータ」を設置しました。
計画中のプロジェクトにマッチした製品をお探しならば、是非ともページ上部のバナーをクリックして下さい。
もし該当する製品が無かった場合は、お気軽に 弊社システム営業グループ 宛にお問い合わせ下さい。

OSDC におまかせ その4 >>


Office Server Document Converter (OSDC) におまかせ その2

■ Microsoft Office をインストールしていない Windows サーバで、Office ファイルを PDF に変換する製品はありますか?

Microsoft Office、今日もお世話になっています。
前回 は、OSDC が Linux サーバで Microsoft Office 文書を PDF に変換できることについて書きました。これで、何の心配もなく Office 文書を共通のファイル形式 (PDF、画像) に変換して管理する文書管理システムが構築できますね。

Windows サーバをお使いならば、そんな心配は余計なお世話だとお考えでしょうか。
ちょっと待ってください。マイクロソフトは、非対話型クライアント アプリケーションまたはコンポーネントから Microsoft Office アプリケーションを使用することを、推奨もサポートもしていないようです。また、技術的な問題とは別に、ライセンスの問題も考慮する必要があるようです

もし、全てのクライアント PC にライセンス認証済みの Office がインストールされているならば、無理に OSDC をお薦めはしません。
WindowsServer で動作するアンテナハウスの PDF Driver 関連製品をお薦めします。詳しくはそれぞれの製品案内をご覧ください。

しかし、 クライアント PC は変換した PDF や画像を閲覧するだけの用途で、特に Office でドキュメントを作成する必要はないとすると、ちょっと頭が痛い問題が発生しますね。開発費用を削って想定外のライセンス費用を捻出しなければなりません。

そうして寄せられたのが、冒頭のお問い合わせです。
「Microsoft Office をインストールしていない Windows server で、Office ファイルを PDF に変換する製品はありますか?」

「Office Server Document Converter(OSDC) にお任せください!」

  • OSDC で対応可能です。
  • Microsoft Office ファイルからの変換に関しては、OSDC 以外必要ありません。
  • PDF への変換の他、画像ファイルへも変換できます。

Office Server Document Converter に関する詳しい情報は、
Office Server Document Converter を、ご覧ください。

評価版もご用意しております。
Office Server Document Converter 評価版のお申し込み
から、お申し込みください。

この度、お客様が「やりたいこと」「したいこと」から弊社のシステムコンポーネント製品を探していただく「製品ナビゲータ」を設置しました。
計画中のプロジェクトにマッチした製品をお探しならば、是非ともページ上部のバナーをクリックして下さい。
もし該当する製品が無かった場合は、お気軽に 弊社システム営業グループ 宛にお問い合わせ下さい。

OSDC におまかせ その3 >>


Office Server Document Converter (OSDC) におまかせ その1

■ Linux 環境で Microsoft Office 文書を PDF に変換できますか?

Microsoft Office、日々お世話になっています。
好むと好まざるとに関わらず、今や文書作成には欠かせない必須アイテムです。
企業や官公庁では、膨大な数の文書が、Microsoft Office を使用して作成されていますが、この保管や閲覧が大変ではありませんか。
「ペーパーレス」が叫ばれて幾年月、今更紙に印刷は無いとは思いますが、これらの文書をそのまま電子文書としてファイリングするにしても、お手軽に文書が作成できるようになった分、様々なソフトとバージョンが入り乱れて、閲覧側のインストール環境の違いで閲覧できないという事態が発生しているのでは。
そこで、これらの文書を共通のファイル形式(PDF、画像)に変換して管理する文書管理システムが各社で作られています。

これでめでたしめでたしとなれば良いのですが、サーバ環境も千差万別、サーバライセンスの購入費用や公共性のためオープンソースに限るなど予算の都合や大人の事情も加わって、なかなか軟着陸とはいかない場合も。

そうして寄せられたのが、冒頭のお問い合わせです。
「Linux 環境でMicrosoft Office 文書を PDF に変換できますか?」
「サーバに Office 互換製品 (OpenOffice/LibreOffice等) の導入は必要なのでしょうか?」

「Office Server Document Converter(OSDC) にお任せください!」

  • OSDC で対応可能です。
  • Microsoft Office ファイルからの変換に関しては、OSDC 以外必要ありません。
  • PDF への変換の他、画像ファイルへも変換できます。

Office Server Document Converter に関する詳しい情報は、
Office Server Document Converter を、ご覧ください。

評価版もご用意しております。
Office Server Document Converter 評価版のお申し込み
から、お申し込みください。

この度、お客様が「やりたいこと」「したいこと」から弊社のシステムコンポーネント製品を探していただく「製品ナビゲータ」を設置しました。
計画中のプロジェクトにマッチした製品をお探しならば、是非ともページ上部のバナーをクリックして下さい。
もし該当する製品が無かった場合は、お気軽に 弊社システム営業グループ 宛にお問い合わせ下さい。

OSDC におまかせ その2 >>