« 2012年07月08日 - 2012年07月14日 | メイン | 2012年07月22日 - 2012年07月28日 »

2012年07月15日 - 2012年07月21日 アーカイブ

2012年07月17日

TextPorter V5.2 MR1, V5.1 MR4, 5.0 MR6について

 TextPorterは、サーバ組込用のテキスト抽出エンジンで、Word, Excel, PDFなど色々なアプリケーションのファイルから文字列を抜き出します。
 前回のブログ担当日から今日までの間に、改訂版として、V5.2 MR1, V5.1 MR4, V5.0 MR6を出荷しましたので、それを紹介します。

 TextPorter V5.2 MR1の改訂内容については、
TextPorter V5.2 MR1
をご覧ください。

 TextPorter V5.1 MR4の改訂内容については、
TextPorter V5.1 MR4
をご覧ください。

 TextPorter V5.0 MR6の改訂内容については、
TextPorter V5.0 MR6
をご覧ください。

 今回の改訂は、主に、Microsoft Office 2007/Office 2010に関するものです。
 一見するとたくさんあるようですが、実は、同じ修正です。Word, Excel, PowerPointの2007と2010に対して行われているので、多く修正されているようにみえるだけです。

 「ストリーム出力で、添付ファイルを処理するとき、入力ファイルのディレクトリを使って一時ファイルを生成する問題」というのは、DMC_GETTEXT_OPT1_TEMPという、ややこしいオプションに関するものです。
 TextPorterは、処理の都合上、一時ファイルが必要な場合は、通常、システムのデフォルトのディレクトリを使います。しかし、システムのデフォルトではなく、出力先と同じディレクトリを使ってくれというお客様の要望があって、このオプションができました。
 しかし、ストリーム出力では、出力先ディレクトリという概念そのものがありません。といって、このオプションは、システムのデフォルトのディレクトリは使わないという意図で設けられたオプションです。仕方がないので、ストリーム主力でこのオプションが指定された場合は、TextPorterは、入力ファイルと同じディレクトリに一時ファイルを作ります。

 さて、セキュリティ意識の高まりに伴って、運用者は、サーバ上で、ファイルを書き込めるディレクトリを、厳しく制限するようになってきました。入力ファイルは、入力なので書き込むことはないという仮定で、入力ファイルがあるディレクトリを書込み禁止に、TextPorterの出力をストリーム、かつ、このオプションを付けるとどうなるでしょうか。
 TextPorterの動作は、不定。すなわち、どうなるかわからないというのが仕様です。
 入力ファイルがある場所に一時ファイルを作ろうと思っても、書込み禁止なので、処理できないのです。

 一番簡単な対処法は、DMC_GETTEXT_OPT1_TEMPを使わないことです。そうすれば、誰でも書き込みが保証されているシステムのデフォルトに一時ファイルを作ります。
 もし、DMC_GETTEXT_OPT1_TEMPを使い、かつ、ストリーム出力を使うときは、入力ファイルのあるディレクトリを書込み禁止にしないように、運用側で、注意してください。

 TextPorterについての詳しい説明は、
TextPorter
をご覧ください。
 評価版もご用意しております。
http://www.antenna.co.jp/axx/trial.html
TextPorter 評価版のお申し込み
から、お申し込みください。

 アンテナハウスのシステム製品につきましては、事前に技術相談会を行っております。お気軽にお問い合わせください。
 詳しくは、
アンテナハウス システム製品技術相談会
をご覧の上、お申し込みください。

2012年07月18日

Server Based Converter V4.0 MR1, V3.1 MR2, V3.0 MR7について

 Server Based Converterは、Microsoft Office, PDFなどのファイルを、PDF, Flash, SVG, 各種画像形式にダイレクトに変換する変換エンジンです。
 ダイレクト変換の意味は、たとえば、Microsoft Officeがない環境でも、ファイルさえあれば、それをダイレクトに内容を見える形式に変換するということです。

 前回のブログ担当日から今日までの間に、改訂版として、V4.0 MR1, V3.1 MR2, V3.0 MR7を出荷しましたので、それを紹介します。

 Server Based Converter V4.0 MR1の改訂内容については、
Server Based Converter V4.0 MR1
をご覧ください。

 Server Based Converter V3.1 MR2の改訂内容については、
Server Based Converter V3.1 MR2
をご覧ください。

 Server Based Converter V3.0 MR7の改訂内容については、
Server Based Converter V3.0 MR7
をご覧ください。

 今回の改訂は、細かなものが多く、多岐にわたりますが、大筋は、レイアウト再現性の向上を目指したものです。早目に、改訂版の導入をお願いします。

 通常、MRはバグ修正のみで、機能追加は行ないませんが、今回のV4.0 MR1では、いくつか機能追加をしています。
(1) WordからPDFの変換において変換結果に合わせた目次を出力できるオプション -docpagenumbercorrection を実装しました。
(2) サポートしていない機能を発見した場合にWarningを返すようにしました。
(3) 暗号化(パスワード)が施されたファイルの処理において、より詳しいエラーを出力するようにしました。

 (1)は、Wordのレイアウト結果とerver Based Converter(SBC)のレイアウト結果が違うことが原因で発生する問題を少しでも解消しようという試みです。
 同じWord文書を表示しても、Wordの結果とSBCの結果が違うことがあります。これは、SBCが、Wordを完全に真似ることができてないことが原因です。

 余談ですが、Wordですら、バージョンが違うと、違ったレイアウト結果になることがあります。これは古くからのWordユーザなら誰もが経験していることでしょう。そういう微妙なところがあります。
 レイアウト結果が違うと、目次に振ってあるページ番号が実際のページとずれてしまうことがあります。たとえば、Wordで見たときに、第3章が30ページ目から始まり、目次では、第3章に対しては30という数字が振ってあるものとします。
 SBCで変換した結果、本来の30ページ目が31ページ目になった場合、目次にある第3章に対する30という数字は、正しくありません。それを補正して31という数字を振るオプションを追加したということです。

 Server Based Converterに関する詳しい情報は、
http://www.antenna.co.jp/sbc/
を、ぜひ、ご覧ください。
 評価版もご用意しております。
http://www.antenna.co.jp/sbc/trial.html
サーバベース・コンバーター 評価版のお申し込み
から、お申し込みください。

 アンテナハウスのシステム製品につきましては、事前に技術相談会を行っております。お気軽にお問い合わせください。
 詳しくは、
アンテナハウス システム製品技術相談会
をご覧の上、お申し込みください。

2012年07月19日

ヤフーやグーグルがメールを勝手に読んでる!?

 ヤフージャパンが、ヤフーメールの内容を解析して、メール内容に合致した広告を入れる「インタレストマッチ広告」サービスを始めることに対して、通信の秘密の侵害ではないか、プライバシーの侵害ではないかと、話題になっています。

 詳しくは、たとえば、
http://diamond.jp/articles/-/21403
新サービスでヤフーが開けた通信の秘密というパンドラの箱

を読んでいただくとして、これは、我々、ICT業界人にとっては、何年も前に話題になったことです。
 というのは、グーグルのGmailというサービスは、まさにこれをやっているからです。

 グーグルがこれを導入したとき、Gmailはプライバシーの侵害だと、アメリカでは大騒ぎになりました。それに対してグーグル幹部が、コンピュータウイルスを調べるのに、メールやファイルをスキャンするのと同じだと、いかにも理系的な返事をしたために、火に油を注いだ状況にもなりました。
 グーグルはGmailを日本でもサービスし、多くのユーザがいますが、なぜ、グーグルが許されて、ヤフーが問題視されるかといえば、メールを保存しているのは日本国外なので日本の法律の適用外、かつ、グーグルは電気通信事業者の届出をしていないので、通信の秘密を守らなければならない法律の適用外。ということのようです。

 Gmailでは、グーグルのコンピュータが、メールを勝手にスキャン(メールを勝手に読んでいる)ことを、知らない人も多いでしょうし、多くの人は、通信の秘密の侵害、プライバシー侵害とも思ってないでしょう。
 実は、グーグルは、Gmailはもとより、他のサービスでも、同社のクラウドにユーザが置いたデータを自由に使える利用規約を定めています。

Google 利用規約(最終更新日: 2012年3月1日)

によれば、
「ユーザーは Google(および Google と協働する第三者)に対して、そのコンテンツについて、使用、ホスト、保存、複製、変更、派生物の作成(たとえば、Google が行う翻訳、変換、または、ユーザーのコンテンツが本サービスにおいてよりよく機能するような変更により生じる派生物などの作成)、(公衆)送信、出版、公演、上映、(公開)表示、および配布を行うための全世界的なライセンスを付与することになります」
となっています。
 グーグルのユーザは、グーグルがユーザのデータをどう料理しても、文句はいいませんと、承認しているのです。逆にいえば、だから無料なのです。
 Gmailの件と同様、これを意識しているユーザも、ほとんどいないでしょう。

参考:
http://iiyu.asablo.jp/blog/2012/06/11/6475359
Google Driveの利用規約がヤバ過ぎる? だったら、他のサービスもだよ。

 なぜ、こんな話を持ち出したかといえば、TextPorterやServer Based Converterにも関係があることだからです。
 それについては、明日。

 TextPorterについての詳しい説明は、
TextPorter
をご覧ください。
 評価版もご用意しております。
http://www.antenna.co.jp/axx/trial.html
TextPorter 評価版のお申し込み
から、お申し込みください。
 Server Based Converterに関する詳しい情報は、
http://www.antenna.co.jp/sbc/
を、ぜひ、ご覧ください。
 評価版もご用意しております。
http://www.antenna.co.jp/sbc/trial.html
サーバベース・コンバーター 評価版のお申し込み
から、お申し込みください。

 アンテナハウスのシステム製品につきましては、事前に技術相談会を行っております。お気軽にお問い合わせください。
 詳しくは、
アンテナハウス システム製品技術相談会
をご覧の上、お申し込みください。

2012年07月20日

ヤフーやグーグルがメールを勝手に読んでる!? その2

 昨日は、
(1) ヤフージャパンが「インタレストマッチ広告」を始める
(2) それを実現するために、メールの内容を解析する
(3) メールの解析を通信の秘密やプライバシー侵害とみなす意見もある
(4) 今回、問題視されていることを、グーグルは何年も前からGmailでやっている
(5) グーグルは、Gmail以外でも、同社のクラウドにユーザが置いたデータに対して、自由に、使用、複製、変更、派生物の作成などができる利用規約になっている
(6) ほとんどのユーザは、それに気づいておらず、プライバシー侵害とも思っていない
(5) これらが、TextPorterやServer Based Converter(SBC)とも関係がある
ということを書きました。

 TextPorterは、PDF, Microsoft Officeなどのファイルから、テキストを抜き出す、テキスト抽出エンジンです。
 SBCは、Microsoft Officeのファイルを、Microsoft Officeなしで、クラウド上で変換し、PDFや画像にする変換エンジンです。

 TextPorterは、ユーザがクラウドに置いた各種ファイルからテキストを抽出し、全文検索やインタレストマッチ広告に使うデータを提供できます。
 企業では、法令遵守(コンプライアンス)強化のため、社員のメールを解析して、機密情報が外部に漏れないようにしたり、社外の人間と怪しいメールをやり取りしていないかチェックするためにも使われています。

 SBCは、ユーザがクラウドに置いた各種ファイルを、ブラウザで表示できるように変換します。これが、派生物の作成に相当します。
 なお、ヤフーやグーグルが、TextPorterやSBCを使っているといっているわけではありませんので、ご注意を。TextPorterやSBCは、ヤフーやグーグルがやっていることをやるための道具立てになり得るということです。
 そして、実際に、いくつもの大企業が、TextPorterやSBCを使って、クラウド上で、日々、ファイルをスキャンし、変換して、生産性向上に役立てています。
 一般消費者向けの製品ではなく、縁の下の力持ちですから、一般ユーザの目には触れませんが。

 TextPorterについての詳しい説明は、
TextPorter
をご覧ください。

 評価版もご用意しております。
http://www.antenna.co.jp/axx/trial.html
TextPorter 評価版のお申し込み
から、お申し込みください。

 Server Based Converterに関する詳しい情報は、
http://www.antenna.co.jp/sbc/
を、ぜひ、ご覧ください。

 評価版もご用意しております。
http://www.antenna.co.jp/sbc/trial.html
サーバベース・コンバーター 評価版のお申し込み
から、お申し込みください。

 アンテナハウスのシステム製品につきましては、事前に技術相談会を行っております。お気軽にお問い合わせください。
 詳しくは、
アンテナハウス システム製品技術相談会
をご覧の上、お申し込みください。

About 2012年07月

2012年07月にブログ「I love software!」に投稿されたすべてのエントリーです。過去のものから新しいものへ順番に並んでいます。

前のアーカイブは2012年07月08日 - 2012年07月14日です。

次のアーカイブは2012年07月22日 - 2012年07月28日です。

他にも多くのエントリーがあります。メインページアーカイブページも見てください。

Powered by
Movable Type 3.34