カテゴリー別アーカイブ: システム製品

TextPorter におまかせ その2

■ 社内の文書ファイルをアーカイブとして利用したいのですが、どうすればよいでしょうか?

とある展示会場で、弊社ブース前でチラシを手に取る来場客に「お声掛け」をした際の返答でした。

「検索システムを作成してはどうですか。うちでは扱っていませんが・・・・」
えーっと、これでは話が終わってしまう。無理矢理こちらの土俵に引き込まなくては。

「データを XML 化すればですね、検索結果を web で閲覧できるし、任意のレイアウトで組版して再配布も・・・・」
いかん、「XML」と「組版」の時点で遠い目になってしまっている。

「XML 構造の設計と XSLT の開発は当方で請負いますが、タグ付けの作業は・・・」
逆効果じゃないか、非日常空間から呼び戻さなくては。

「そのためには、テキストの抽出が必要になります。」
お、やっと言葉が通じたか。

「文書ファイルからテキスト情報を抽出する機能は,検索システムや文書管理システムには必須機能です。TextPorter は、さまざまなアプリケーションのファイルからテキストを抽出する、サーバ組込用テキスト抽出エンジンです。」
突然、カタログ的説明口調になっている。

「TextPorter で文書からテキストを抽出して、全文検索システムで検索できるようにしておくことで、目的の文書をすばやく探し出せます。」
XML の件は無かったことにしました。

『TextPorter にお任せください!!』

その後、この話がどう展開したか。それは、また別のお話し。

「TextPorter」 は、次のようなシステム、または汎用製品に組み込まれており採用実績があります。

  • 文書管理ソフトウェア製品に組み込み
  • 全文検索エンジンと共にグループウェアに組み込み
  • 企業内文書管理システムに組み込み
  • 電子メール・サーバ製品に組み込み
  • インターネット情報検索アプリケーションに組み込み
  • イントラネット・テキスト・マイニング・サーバに組み込み
  • セキュリティ管理製品に組み込み

Microsoft Office, PDF など主要なアプリケーション・ファイルを識別し、作成したアプリケーションがなくても、ファイルからテキストを抽出可能です。
しかも、ファイルの拡張子ではなく、ファイル内部の情報に基づいて識別しますので、正確な判別が可能となります。

対応しているファイル形式は、 「抽出対象ファイル形式」https://www.antenna.co.jp/axx/function02.html
をご覧ください。

「TextPorter」に関する詳しい情報は、製品ページ
https://www.antenna.co.jp/axx/
を、ぜひ、ご覧ください。

評価版もご用意しています。
評価版のお申し込み
https://www.antenna.co.jp/axx/trial.html
から、お申し込みください。

<< TextPorter におまかせ その1           TextPorter におまかせ その3 >>


TextPorter におまかせ その1

■ 様々な文書ファイルからテキスト部分を抽出できる製品はありますか?

重要文書が突然消えたかと思うとひょっこり現れたりと、ドキュメントの「神隠し」が横行しているからというわけではないでしょうが、紙文書の電子化で業務の効率化と省スペース化するサービス、まだまだ需要は尽きないようです。

「今頃紙の電子化なんて」と思われた方、文書が全て電子化できているからと安心してはいませんか。
では、過去に作成された大量のドキュメント・ファイル、どのように活用していますか。
多種多様なアプリケーション、異なるバージョンでファイル形式の百花繚乱!
いざドキュメントを開こうとしてもアプリが見つからず、サーバの中で塩漬けになっていては、紙文書を倉庫に積み上げているのと変わりません。

~ドキュメント、役に立たなきゃただのゴミ~

  1. 各種アプリケーションのデータを、編集可能な形式にコンバート
  2. 各種アプリケーションのデータを、一括でPDFや画像に変換
  3. PDFから各種アプリケーションソフトのデータにコンバート

レガシーデータの再利用には様々な方法があります。
いずれの場合も、アンテナハウスの製品を利用すれば簡単に実現できますが、今回は書面の再現・再利用ではなく、ドキュメントからテキストを抽出する方法をご提案します。

体裁ではなく中身(テキスト)が重要!
データベース化し、手軽に検索して閲覧するのが目的ならば、大量のファイルから高速にテキストを抽出できる方法が鍵になりますね。
しかし、多種多様なファイル形式とバージョンが混在していて、ファイル形式別に仕分けするのは至難の業・・・

『TextPorter にお任せください!!』

「TextPorter」 は、さまざまなアプリケーションのファイルからテキストを抽出する、クラウドコンピューティング時代のサーバ組込用テキスト抽出エンジンです。
Microsoft Office, PDF など主要なアプリケーション・ファイルを識別し、作成したアプリケーションがなくても、ファイルからテキストを抽出可能です。
しかも、ファイルの拡張子ではなく、ファイル内部の情報に基づいて識別しますので、正確な判別が可能となります。
対応しているファイル形式は、 「抽出対象ファイル形式」 をご覧ください。昔懐かしい(年代が知れます)各種ワープロ文書にも対応しています。

「TextPorter」 は、対応ファイルの多さなどが評価され、ウェブサービス、パブリッククラウド、プライベートクラウドなどで、検索エンジン、ウイルス対策ソフト、企業機密の漏洩を防ぐソフトなどに利用されています。

「TextPorter」 に関する詳しい情報は、製品ページ
https://www.antenna.co.jp/axx/
を、ぜひ、ご覧ください。

評価版もご用意しています。
評価版のお申し込み
https://www.antenna.co.jp/axx/trial.html
から、お申し込みください。

TextPorter におまかせ その2 >>


Office Server Document Converter(Server Based Converter含む) 及び TextPorter のメンテナンスリリースについて

Office Server Document Converter(Server Based Converter 含む)及び TextPorter のメンテナンスリリースについて紹介させていただきます。
各製品をお使いのお客様で、弊社と保守契約を結んでいらっしゃるお客様には、バグ修正を行ったメンテナンスリリース (MR) を配布しております。

ご提供間隔としては、

  •  最新版につきましては、おおよそ4ヵ月に1回、年3回を目安とした配布
  •  最新版以外のバージョンにつきましては、バグ修正の状況に合わせ、おおよそ半年または1年に1回を目安とした配布

としております。何卒、ご活用ください。

<Office Server Document Converter(Server Based Converter 含む)>

2018/3/12 に Office Server Document Converter V6.1 MR2 と Server Based Converter V6.0 MR5 をリリースいたしました。旧バージョン(SBC5.2MR10、V5.0MR11、V4.0MR12)は、3/19から3/27順次リリースいたしました。
なお、V4.0はMR12が最終版となります。

改定情報は、以下をご参照ください。

■ 次回改訂版リリース予定
2018/7/10にOffice Server Document Converter V6.1 MR3 と Server Based Converter V6.0 MR6をリリースいたします。
旧バージョンの改訂版は、年末リリースを予定しています。

各バージョンの保守期限に関しては、保守期限のページ にてご確認ください。

Office Server Document Converter(Server Based Converter 含む)は、Microsoft Office, PDF などのファイルを、PDF, Flash, SVG, 各種画像形式にダイレクトに変換する変換エンジンです。 ダイレクト変換の意味は、たとえば、Microsoft Office がない環境でも、ファイルさえあれば、それをダイレクトに内容を見える形式に変換できるのです。ダイレクト変換には、Microsoft Office のライセンスも不要です。
Office Server Document Converter(Server Based Converter含む)は、ダイレクト変換というユニークさが評価され、多くのウェブサービス、パブリッククラウド、プライベートクラウドなどで利用されています。

OSDCに関する詳しい情報は、製品ページ
https://www.antenna.co.jp/sbc/
を、ぜひ、ご覧ください。

評価版もご用意しております。
評価版のお申し込み
https://www.antenna.co.jp/sbc/trial.html
から、お申し込みください。

<TextPorter>

■ 次回改訂版リリース予定
2018年6月中に V5.4MR4 のリリースを予定しております。
前回(V5.4MR3)までの改訂内容に関しては、こちら をご参照ください。TextPorter は、サーバ組込用のテキスト抽出エンジンです。Microsoft Office, PDF など様々なアプリケーションのファイルから文字列を抜き出します。
TextPorter は、対応ファイルの多さなどが評価され、ウェブサービス、パブリッククラウド、プライベートクラウドなどで、検索エンジン、ウイルス対策ソフト、企業機密の漏洩を防ぐソフトなどに利用されています。

TextPorterに関する詳しい情報は、製品ページ
https://www.antenna.co.jp/axx/
を、ぜひ、ご覧ください。

評価版もご用意しております。
評価版のお申し込み
https://www.antenna.co.jp/axx/trial.html
から、お申し込みください。

◎「製品ナビゲータ」好評公開中!
お客様が「やりたいこと」「したいこと」から弊社のシステムコンポーネント製品を探していただく「製品ナビゲータ」を設置しました。計画中のプロジェクトにマッチした製品をお探しならば、是非ともページ上部のバナーをクリックして下さい。
もし該当する製品が無かった場合は、お気軽に弊社システム 営業グループ宛 (sis@antenna.co.jp) にお問い合わせ下さい。


『Antenna House PDF Tool API』(PDF Tool API)をブラウザから呼び出して利用するデモ (2)

『Antenna House PDF Tool API』(PDF Tool API)は、PDFファイルの情報取得やPDFファイルの加工・編集を行うライブラリです。
PDFに関するさまざまな処理機能を搭載しています。
文書情報やページ数などの情報取得、ページの挿入や削除、透かしの挿入、セキュリティ設定などのファイル加工、ページコンテンツのテキストや画像の削除、画像の最適化(ダウンサンプリング)といったページ編集処理が可能です。

2018年 5月 9日から 3日間の日程で開催される「第 27 回ソフトウェア&アプリ開発展」(通称 SODEC ) にアンテナハウスは今年も出展致します。
この中で、『Antenna House PDF Tool API』(PDF Tool API)をブラウザから呼び出して利用するデモを展示しております。
サーバ側には、サーブレット・コンテナ(Tomcat)、PDF Tool API の Linux(64bit)版一式をインストールしてあります。
クライアント側は、ブラウザとなります。

処理モード

テキスト取得、テキスト追加、イメージ追加、墨消し追加の4つのモードから選択できます。
マウスをドラッグして、矩形を設定します。処理モード応じた領域が画面上に追加されます。
追加された領域は、拡大・縮小や移動が可能です。
追加された領域は、フォーカスを与えると、ツールバーが表示されます。ツールバーを使って設定が変更できます。

テキスト追加

テキスト追加で配置した領域は、テキスト、注釈、透かしとして設定できます。
配置した領域にフォーカスを設定すると、ツールバーが表示されます。このツールバーの左から2番目のコンボボックスで変更します。
設定画面のスクリーンショットと、設定を反映したPDFのスクリーンショットです。

  • テキストとして設定

    pdftoolt11PDF Tool API PtlParamWriteString, PtlContent.writeString を使用します。

    保存したPDFのプレビュー

    pdftoolt12

  • 注釈として設定

    pdftoolt21PDF Tool API PtlAnnotText, PtlAnnotPopup, PtlAnnots.append を使用します。

    保存したPDFのプレビュー

    pdftoolt22

  • 透かしとして設定

    pdftoolt31
    PDF Tool API PtlParamWaterMarkText, PtlPDFDocument.appendWaterMark を使用します。

    保存したPDFのプレビュー

    pdftoolt32

イメージ追加

イメージ追加で配置した領域は、イメージ、注釈、透かしとして設定できます。
配置した領域にフォーカスを設定すると、ツールバーが表示されます。このツールバーの左から2番目のコンボボックスで変更します。
設定画面のスクリーンショットと、設定を反映したPDFのスクリーンショットです。

  • イメージとして設定

    pdftooli11
    PDF Tool API PtlParamDrawImage, PtlContent.drawImage を使用します。

    保存したPDFのプレビュー

    pdftooli12

  • 注釈として設定

    pdftooli21

    PDF Tool API PtlParamDrawImage, PtlAnnotStamp, PtlAnnots.append を使用します。

    保存したPDFのプレビュー

    pdftooli22

  • 透かしとして設定

    pdftooli31
    PDF Tool API PtlParamWaterMarkImage, PtlPDFDocument.appendWaterMark を使用します。

    保存したPDFのプレビュー

    pdftooli32

製品に関するご質問は
sis@antenna.co.jp(SYSTEM担当)
または
oem@antenna.co.jp(OEM担当)
まで、お気軽にお問い合わせください。

評価版のお申込
評価版のお申込ページ

Webページ
https://www.antenna.co.jp/ptl/


『Antenna House PDF Tool API』(PDF Tool API)をブラウザから呼び出して利用するデモ (1)

『Antenna House PDF Tool API』(PDF Tool API)は、PDFファイルの情報取得やPDFファイルの加工・編集を行うライブラリです。PDFに関するさまざまな処理機能を搭載しています。
文書情報やページ数などの情報取得、ページの挿入や削除、透かしの挿入、セキュリティ設定などのファイル加工、ページコンテンツのテキストや画像の削除、画像の最適化(ダウンサンプリング)といったページ編集処理が可能です。

2018年 5月 9日から 3日間の日程で開催される「第 27 回ソフトウェア&アプリ開発展」(通称 SODEC ) にアンテナハウスは今年も出展致します。
この中で、『Antenna House PDF Tool API』(PDF Tool API)をブラウザから呼び出して利用するデモを展示しております。
サーバ側には、サーブレット・コンテナ(Tomcat)、PDF Tool API の Linux(64bit)版一式をインストールしてあります。
クライアント側は、ブラウザとなります。

トップ画面

pdftool

サイドバー

  • [PDFを選択]

    PDFファイルをサーバへアップロードした後、ページの内容を表示します。

  • [out] [in]

    表示倍率を変更します。

  • [prev] [next]

    表示ページを変更します。

  • 処理モード

    テキスト取得、テキスト追加、イメージ追加、墨消し追加の4つのモードから選択できます。

  • [PDFを保存]

    アップロードしたPDFと、編集内容から、PDF Tool API を使用して、新しくPDFを生成します。生成後にPDFのダウンロードとなります。

処理モード

テキスト取得、テキスト追加、イメージ追加、墨消し追加の4つのモードから選択できます。
マウスをドラッグして、矩形を設定します。処理モード応じた領域が画面上に追加されます。
追加された領域は、拡大・縮小や移動が可能です。
追加された領域は、フォーカスを与えると、ツールバーが表示されます。ツールバーを使って設定が変更できます。

  • テキスト取得

    選択した矩形内のテキストを取得します。

  • テキスト追加

  • 矩形内にテキストを追加します。
    フォントサイズ、文字色を変更できます。
    領域は、テキスト、注釈、透かしとして設定できます。
  • イメージ追加

  • 矩形内にイメージを追加します。
    イメージファイルとして、BMP、JPG、PNG が選択できます。
    領域は、イメージ、注釈、透かしとして設定できます。
  • 墨消し追加

  • 墨消しを設定した領域は、PDF内から文字データなどが消去され、代わりに塗りつぶしを書き込みます。

使用例

pdftool002

3つの領域を追加しています。上から順番に次のように設定しました。

  • テキスト領域

    テキストとして追加する。フォントサイズは24pt、文字色は赤。

  • イメージ領域

    イメージとして追加する。設定した画像はアンテナハウスのロゴ(PNG)。

  • 墨消し追加

    塗りつぶし色は青。

PDFを保存

PDF Tool API により、アップロードされているPDFと、3つの領域の内容を使って、新しくPDFを生成します。
ダウンロードされた PDF のスクリーンショットです。
文字列「あいうえお」(少しわかりにくいですが)、イメージ「アンテナハウスのロゴ」、「墨消し領域」が反映されています。
墨消しの設定により、領域内にある文字列「じゃがいも」から「好みで」までの文字情報はPDFから削除されます。

pdftool003

製品に関するご質問は
sis@antenna.co.jp(SYSTEM担当)
または
oem@antenna.co.jp(OEM担当)
まで、お気軽にお問い合わせください。

評価版のお申込
評価版のお申込ページ

Webページ
https://www.antenna.co.jp/ptl/


oXygen XML Editor 20.0 の販売を開始いたしました!

mb_author

 oXygen XML Editor 20.0 の販売を2018年03月16日から開始いたしました。

oXygen XML Editor は先進のXMLオーサリング・開発機能とグラフィカルな編集プラットホームを提供し、世界各国で愛用されています。
Windows、Mac OS X、Linuxに対応し、ユーザーインタフェースには日本語版も用意されています。

oXygen XML Editor にはDITAで書かれた文章を、HTMLで構成された WebHelp(Webページ)に変換する機能を備えています。

例えば以下のように書かれたDITA文書を WebHelpに変換すると・・
oXygen XML Editor01

 

ボタンひとつで、このようなWebページを作成することができます。
oXygen XML Editor02

 

先ほどのDITA文書をPDFに変換することもできますよ。
こちらレイアウトにはアンテナハウスで開発した pdf5.mlを使用しています。

oXygen XML Editor03

ひとつの文章から、Webページを作成したり、PDFを作成したり、色々なことができます。

oXygen XML Editor の WebHelpは最初からレイアウトのテンプレートが用意されているので、簡単にレイアウトを変更することができます。
例えば、空と雲をモチーフとしたレイアウト。
oXygen XML Editor04

 

テクノロジーをモチーフとしたレイアウト。
oXygen XML Editor05

 

もちろんスタンダードでシンプルな青色をモチーフとしたレイアウトもあります。
oXygen XML Editor06

 

他にも色々なテンプレートが用意されています。
テクニカルな要素は増えますが、自分でテンプレートを作成することもできます。

テンプレートの作成方法(英語)
https://www.oxygenxml.com/doc/versions/20.0/ug-editor/topics/whr_publishing_template_contents.html

WebHelpはレスポンシブデザインで設計されているので、モバイル機器の表示にも対応しています。すごい!

ここまでくると、もはやエディタという感覚ではなく、システムという感覚に近いですね。

oXygen XML Editor 20.0 で追加された主な機能は以下です。

・ DITA

  • 未参照のキー定義をレポートする
    [DITA マップ 完全度の確認]ダイアログボックスに新しく[参照されていないキー定義を報告する]が追加され、 参照されていないキー定義をレポートすることができます。
  • 未参照の再利用可能な要素をレポートする
    [DITA マップ 完全度の確認]ダイアログボックスに新しく[参照されていない再利用可能な要素をレポートする]が追加され、 どこにも参照されない潜在的な再利用可能な要素をレポートすることができます。
    これらは、ID属性を持ち、リソースのみとしてマークされたトピック、または他の要素が再利用されるトピックで定義される要素です。

・ WebHelp

  • 公開テンプレート
    WebHelpレスポンシブ出力のルックアンドフィール(レイアウトとスタイル)を定義します。 これらのテンプレートは、チームと簡単に共有できるカスタマイズパッケージを表します。
  • ビルトイン公開テンプレートギャラリー
    oXygenには組み込みの公開テンプレートが付属しています。 これは、WebHelp変換シナリオの[ テンプレート ]タブで利用できます。 フィルタリングオプションとテンプレートプレビュー画像を使用して、 必要なテンプレートを簡単に見つけることができます。

・・・などなど、これらが追加された機能の一部となります。(追加機能が多すぎて書ききれません!)
詳細はアンテナハウスのホームページをご覧ください。
https://www.antenna.co.jp/oxygen/#v20.0

oXygen XML Editor はバージョンアップの度に、沢山の機能が追加されます。
こちらのページでは oXygen XML Editor 19.0 19.1 20.0 に追加された機能を紹介しています。
https://www.antenna.co.jp/oxygen/new-feature190-200.html

  • マスターファイルサポート
  •  DITA再利用コンポーネントビュー
  • PDFとXHTML出力のフロート画像
  • DITAトピックタイプの変換
  • oXygen WebHelp テンプレート

DITAやWebHelpに関する機能がとても充実していますね!

oXygen XML Editor に関してはアンテナハウスまで お問い合わせ ください!(oxygen@antenna.co.jp


Formatter で MathML を PDF にしてみる

弊社の AH Formatter は世界中で愛用されている XML 自動組版エンジンですが、今回はちょっと違った使い方をしてみます。
ただマニュアルに書かれた使い方ではないので、あくまでも自己責任ということで…

MathML を画像ファイルや PDF にしたいという話はたまに聞くのですが、これを Formatter を使ってやってみます。

まず Formatter の GUI を立ち上げます。

formatter01

ここに MathML で書かれたファイルをドラッグアンドドロップすると

formatter02
こんな感じに可視化することができます。Formatter って MathML のビューアとしても使えるんですね。

最後にファイルメニューから「PDF出力」を選ぶと、表示されたままのイメージで PDF 保存できます。

formatter03

GUI を使わずにコマンドライン インターフェースを使ってもできるみたいです。
ahfcmd -d sample.mathml -o sample.pdf

通常は MathML にリンクを張った XSL-FO を作って、それを Formatter にレンダリングさせなければならないのですが、XSL-FO を作らなくてもいいなんて、超便利。
繰り返しになりますが、公式な使い方ではないのでご注意を。


海外出展情報 その2

Xploration 18 は、Xplor International、Electronic Document Systems AssociationR が主催する、プレゼンテーションと展示の両方を提供する会議で、 出席者が電子文書の傾向、ベストプラクティス、規定、新技術について学ぶ場です。 アンテナハウスが Xploration 18 で展示を行ったのは今年で2年目となります。

4月23日、Antenna House はコロラド州デンバーの CMS / DITA 北米会議 に出席いたしました。 この会議は、Center for Information-Development Management(CIDM)が主催し、プレゼンテーション、ワークショップ、展示などを行っています。 アンテナハウスは毎年 CMS/DITA North Americaで展示を行い、今年は多言語フォーマットに関するセッションで [ Formatting languages is easy as pie with DITA-OT and PDF5 (-ML Plugin)! ]  という題目で、展示を行いました。

DITA NA

アンテナハウス(海外サイト)
http://www.antennahouse.com/
http://www.rainbowpdf.com/

<< 海外出展情報 その1


海外出展情報 その1

米国アンテナハウスは今月(4月)2週間にわたって3つの異なるイベントに出席して参りました。 4月16日の週に、ワシントン DC で開催された JATS-Con 2018、フロリダ州オーランドで開催された Xploration 18 、そして4月23日は、コロラド州デンバーで開催の CMS/DITA North America に参加いたしました。

JATS-Con は、ジャーナル・アーティクル・タグ・スイート(JATS)を使用している、または学ぶことに関心のある人のための、2日間の会議です。 JATS は、学術雑誌を XML で記載する際に使われるスキーマの1種で、学術雑誌を記述するときの基準となる規格となっています。初回の JATS-Con は 2010 年に開催されました。会議の主催者、National Library of Medicine は Antenna House Formatter のユーザーで、JATS 実装のための XSL スタイルシートを開発しそれをパブリックドメイン(公有化)として提供しています。今年はアンテナハウスは JATS-Con の出席者として参加しました。この会議は、いつもアンテナハウスの多くのユーザーと出会う大変良い機会となっています。

あと2つのイベントについては明日ご紹介いたします。

アンテナハウス(海外サイト)
http://www.antennahouse.com/
http://www.rainbowpdf.com/

海外出展情報 その2 >>


『PDF Viewer SDK SP版 V1.2』

前回、PDF の組み込み用 SDK 『Antenna House PDF Viewer SDK V3.5』 をご紹介しておりますが、表示速度を向上した PDF Viewer SDK SP版 というライブラリもご用意しております。
このライブラリは、PDF Viewer SDK よりも出来る機能が少ないが、表示は速いというものになります。いろいろな機能は不要で、単純に PDF を表示させるだけの用途に適しております。

今回 V1.2 では、サムネイル表示が可能になり、これにより、ページの入れ替え、削除、ページの挿入が可能になりました。
PDF Viewer SDK との速度比較や、その他機能の詳細は、
> PDF Viewer SDK SP版 をご参照ください。

評価版を用意しております。

お申し込みは、mailto:oem@antenna.co.jp までメールにてお申し込み下さい。


Pages: Prev 1 2 3 4 5 6 7 8 9 10 ... 12 13 14 Next