タグ別アーカイブ: textporter

アンテナハウス製品におけるJava 11以降の動作確認と動作保証

2019年1月でJava 8のサポートが切れます。
そして、2018年9月下旬、Java 11が予定通り出荷され、お客様からの問い合わせが入っていますので、アンテナハウス製品におけるJava 11以降の動作確認、動作保証について、現段階での方針をお知らせします。

Oracleが、これまで無償で配布してきたJDKのサポートを有償化するという話が出て、いろいろと混乱した話が飛び交いましたが、OpenJDKを使えば、無償で使えます。
OpenJDKは、OracleからJDKのソースコードの提供を受けて、いろんな企業や団体がビルドして無償で配布しているもので、企業や団体によって、有償サポートがあったりなかったり、サポート料やサポート期間もマチマチです。
この辺は、Linuxに各種のディストリビューションがあるのと似ています。
詳しい話は、参考に挙げた記事やサイトをお読みください。

アンテナハウスは、OpenJDKの中でも、LTS(Long Term Support)バージョンのOpenJDKを、無償で、最低4年間は、セキュリティやバグフィックスのアップデートを提供するといっているAdoptOpenJDKによって、動作確認と動作保証を始めています。
AdoptOpenJDKのJava 11は、最低、2022年9月までアップデートが提供される予定です。

AdoptOpenJDK

AdoptOpenJDK Support

First Availability End of Availability [1]
Java 8 (LTS) March 2014 At Least Sep 2023 [2]
Java 9 Sept 2017 March 2018
Java 10 March 2018 Sept 2018
Java 11 (LTS) Sept 2018 At Least Sept 2022 [2]

AdoptOpenJDKでダウンロードできるバイナリのうち、アンテナハウスが動作確認、動作保証の対象とするJava 11は、「OpenJDK 11 Hotspot」です。
Hotspotは、元々Sun(Javaの本家)が作ったJVM(Java仮想マシン)です。Oracleがメンテナンスや機能拡張をしています。これがリファレンスと考えてよいので、このJVMのみ動作保証対象にする予定です。
理由は、JVMは多くの実装があるので、やり出したら、きりがないからです。
たとえば、上記サイトには、Java 11でも、
「OpenJDK 11 with Eclipse OpenJ9」
がありますが、OpenJ9は、IBMが開発したJVMです。これは動作保証の対象にはしない予定です。
アンテナハウス自身が、動作確認、動作保証をするJVMを限定することについては、何卒、ご了承ください。

現在、アンテナハウス製品で使われているJavaのコードは、Java 8のコンパイラでビルドして出荷していますが、動作確認を始めた製品では、いずれも、問題なくJava 11で動いています。
アンテナハウスの製品のうち、Javaを使っている製品については、いずれ、各製品のウェブページで、動作確認が取れたことをお知らせしていく予定です。
なお、Java 8のコンパイラからJava 11のコンパイラに切り替える時期は未定です。
Java 11のコンパイラでビルドすると、Java 11の実行環境が必要になり、Java 8では動かなくなることが予想されます。
2019年1月でJava 8のサポートが切れるといっても、すぐ、Java 11に乗り換えられるお客様は、そんなに多くないだろうと考えていますので、2019年早々のコンパイラの切り替えは考えていません。
Javaを使っているアンテナハウス製品のリリース時期によりますが、今後、1年から数年をかけて、コンパイラを切り替えていくことになるでしょう。

参考:
【GlassFish勉強会レポート】各JDKベンダの動向を知ってJava 11に備えよう
2018年10月5日
杉山貴章

Javaは今も無償です

Oracle Java SE サポート・ロードマップ
(2018年 9月25日更新)

Time to look beyond Oracle’s JDK
Monday, 3 September 2018


TextPorterのテキストファイルからのテキスト抽出について

 TextPorterは、Word、 Excel、 PowerPoint、 PDFなどのファイルからテキストを抜き出すのですが、なぜか、テキストファイルからテキストを抽出する機能もあります。
 元がテキストファイルなら、わざわざテキストを抽出する必要はないだろうと、普通は思うのですが、お客様によっては、そうではないのです。
 テキストファイル以外に、Word、 Excel、 PowerPoint、 PDFのファイルが混在しているディレクトリから、一気に抽出したいというお客様がいらっしゃって、だったら、ファイルの拡張子でテキストファイルだけ除外して、TextPorterに処理させればいいのにと思いますが、それも面倒だというお客様もいらっしゃるのです。
 さらに欲張りなお客様は、テキストファイルの文字コード変換もやってくれと、おっしゃいます。
 というわけで、TextPorterは、テキストファイルからテキスト抽出する機能に加えて、テキストファイルの文字コード変換機能も備えています。
 テキストファイルの文字コード変換機能を有効にするには、DMC_GETTEXT_OPT1_TXCONVというオプションを指定してください。もちろん、変換先の文字コードの指定も必要です。
 さらに、DMC_GETTEXT_OPT1_TXCONV2というオプションもあって、これは、
「テキストをコード変換する際に、元のエンコードが判別できない場合は、テキストを書き出さない」
というオプションです。
 これもお客様の要望です。
 ややこしいですね。
 TextPorterは、サーバ組込用のテキスト抽出エンジンです。Microsoft Office、 PDFなど様々なアプリケーションのファイルから文字列を抜き出します。
 TextPorterは、対応ファイルの多さなどが評価され、ウェブサービス、パブリッククラウド、プライベートクラウドなどで、検索エンジン、ウイルス対策ソフト、企業機密の漏洩を防ぐソフトなどに利用されています。
 TextPorterについての詳しい情報は、
TextPorter 製品ページ
をご覧ください。
 評価版もご用意しております。
 TextPorter 評価版のお申し込みから、お申し込みください。
 アンテナハウスのシステム製品につきましては、事前に技術相談会を行っております。お気軽にお問い合わせください。
 詳しくは、
アンテナハウス システム製品技術相談会
をご覧の上、お申し込みください。