月別アーカイブ: 2019年2月

Office Server Document Converter v7.0改訂1版(MR1)リリース

~続 Office2019の新機能にも対応~

Office Server Document Converter v7.0改訂1版(MR1)は、Office2019の新機能に対応しました。というお話を 昨日 させていただきましたが、本日はその続編となります。

1. デジタル ペン、インク機能に対応(Word,Excel,PowerPoint)

デジタル ペンやマウスを使用して図形やテキストを手描き入力するもので、Word、PowerPointでペン書きの場合筆圧と傾きが感知されるようになりました。

サンプルの文字がなぜ「Rainbow」「Galaxy」かといいますと、ペンの色にメタリックペン風の「レインボー」と「銀河」を選択しているためです。深い意味はありません。
マウスで書いたため、色だけでなく書体も「前衛的な書初め」みたいになりましたが、これを変換してみました。

OSDC104

なお、今回は使っていませんが蛍光ペンの透過効果には対応していないため、マーキングした文字は潰れてしまいます。

2. LaTeXの数式構文に対応(Word)

Wordでは、数式を作成して編集できるLaTeXの数式構文をサポートするようになりました。

「行形式」で表示したものを変換してみました。
行形式はそのままで表示されます。OSDCで変換しても「二次元形式」では表示されませんので、悪しからず。

OSDC106

また、数式に改行指示が無い場合は成り行き改行に対応していないため、欄外にはみ出てしまいます。

次に、Word上で「二次元形式」に変換したものの変換結果です。

OSDC105

これは、既にOSDC V7.0にバージョンアップした際に数式に対応しているため、目新しいものではありません。
OOXMLの数式に対応(Word数式エディタ対応) を参照ください。
なお、数式処理についてはなかなか奥が深く、今回の改訂版でも改修対応をしています。

ということで、いかがでしたでしょうか。

せっかく張り切ってOffice2019の新機能を使ってドキュメントを作成したのに、PDFや画像に変換したら反映されていなかったら、残念では済まされません。
一朝一夕では解決できない課題もありますが、日々改善に努めてまいりますので、よろしくお願い致します。

その他にも、にOSDC V7.0にバージョンアップの際に以下の機能を強化しています。

機能についてのご要望等がありましたら、こちら までお気軽にお寄せ下さい。

ところで、何気に「Windows Server 2019」にも対応をしました。目立たずさらっと、一言  ですが。

Office Server Document Converter に関する詳しい情報は、
https://www.antenna.co.jp/sbc/ を、ご覧ください。

評価版もご用意しております。
Office Server Document Converter 評価版のお申し込み
から、お申し込みください。

アンテナハウスではPDFの生成、読み込み、編集、表示ライブラリーを自社開発ライブラリーとして保有しています。こうした基本技術や製品をお客様のシステムに組み込む受託の開発も行っています。お気軽に、お問い合わせ下さい。


Office Server Document Converter v7.0改訂1版(MR1)リリース

~Office2019の新機能にも対応~

先日お約束致しました通り、本日Office Server Document Converter v7.0改訂1版(MR1)をリリース致しました。
改訂情報は こちら をご覧ください。

今回の目玉は、Office2019の新機能(の一部)に対応したことです。

主だったところでは以下の4点です。

  • アイコンとSVG の挿入に対応(Word,Excel,PowerPoint)
  • 3Dモデルの挿入に対応(Word,Excel,PowerPoint)
  • デジタル ペン、インク機能に対応(Word,Excel,PowerPoint)
  • LaTeXの数式構文に対応(Word)

まずは視覚的に派手なものからご案内をします

1. アイコンとSVG の挿入に対応(Word,Excel,PowerPoint)

公式サイトで「ドキュメント、ワークシート、プレゼンテーションに視覚的な効果を追加しましょう!」と謳っている機能ですので、利用される方が多いのではないかと思います。
これに対応できなくては「しょぼい」の一言で片付けられてしまいます。

こんな結果となりました。

OSDC102

アイコンの挿入では、来年の東京オリンピック開幕を意識してみました。
なぜ、関係ないウインタースポーツのアイコンが多いかと言いますと・・・・、単なる趣味の問題です。冬季オリンピックは再び来るのでしょうか。
オリンピックでは、開会式とは違った閉会式の緊張感が解けた感じも好きです。

SVGの挿入はこんな結果です。

OSDC103

SVGデータは、弊社製品「AH Formatter」の資料からの抜粋です。
随分古い資料と思われた方、素晴らしい目利きです。製品名もそうですが、今時フロッピーディスクは無いですね。

2. 3Dモデルの挿入に対応

こちらも、「ドキュメント、ブック、プレゼンテーションに直接3Dモデルを挿入して、ポイントを説明することができます!」とのことですので、やっぱりやるしかないでしょ。

3Dモデルの挿入、こんな結果となります。

OSDC101

ちなみに、3Dモデルは変換後もグルグル360度回転をするわけではありませんので、悪しからず。
あくまでも画像の貼り込みと同じです。
というところでお時間が参りました。
続きは明日ということで、よろしくお願い致します。

Office Server Document Converter に関する詳しい情報は、
https://www.antenna.co.jp/sbc/ を、ご覧ください。

評価版もご用意しております。
Office Server Document Converter 評価版のお申し込み
から、お申し込みください。

アンテナハウスではPDFの生成、読み込み、編集、表示ライブラリーを自社開発ライブラリーとして保有しています。こうした基本技術や製品をお客様のシステムに組み込む受託の開発も行っています。お気軽に、お問い合わせ下さい。

sysjutaku


Officeが変われば、Office Server Document Converterも変わる!

~OSDCv7.0改訂1版(MR1)リリース予告~

前回のOSDCV7.0販売開始のご案内から、早いもので3ヶ月が経ちました。
皆様いかがお過ごしでしょうか。

ところで、昨年秋にリリースされたOffice2019を、お使いになられていますでしょうか。
そう言えばそんなニュースがあったようだが、Office365でサブスクリプションの契約だから気にもしていなかった。
とか、Office2010の延長サポートギリギリまで粘るからまだまだ。とか、Windows10の無償バージョンアップし忘れまして・・・。などとおっしゃる方の、何と多いことか。

興味深い機能や多数の改善が行われているようなので是非とも、などというOffice2019の紹介・宣伝記事は専門サイトに任せておきまして、今回もOffice Server Document Converter(OSDC)の近況報告をさせていただきます。

Officeが変われば、Office Server Document Converterも変わる!

Office2019の新機能に対応したOSDCv7.0改訂1版を、2月27日にリリース致します。
Office2019に対応することと共に、Office365の現状の機能に追いつくことが目的です。厳密にはOffice365とOffice2019は同一ではありませんが、何しろOffice365は足が速い。
とりあえず、節目の一里塚を立てたという感じです。

Officeの新バージョン対応となると、かつては賑々しくこちらもバージョンアップで応えたものですが、今回は地味に改訂版なのはなぜかと言いますと。
手抜き?いえいえ。
実は、OSDCが元々持っていた機能の応用で、Officeの新機能を使ったドキュメントを変換再現できてしまいまして、流石OSDCの機能の奥深さと先見の明と関係者一堂ドヤ顔なのでありました。

とはいえ、「対応」の陰には少なからず「制限事項」もあるので、継続的な改善は必須と考えています(真顔)。

ということで、またもリリース前の予告広告。
主な対応機能は、以下の通りです。

  • 描画:ペン、デジタルインクの図形への変換(Word,Excel,PowerPoint)
  • 3Dモデル(Word,Excel,PowerPoint)
  • アイコンとSVG の挿入(Word,Excel,PowerPoint)
  • LaTeX の数式のサポート(Word)

詳細については、順次ご報告をさせていただきます。
OSDCv7.0改訂1版、2019年2月27日にリリース!
乞うご期待!

Office Server Document Converter に関する詳しい情報は、
https://www.antenna.co.jp/sbc/ を、ご覧ください。

評価版もご用意しております。
Office Server Document Converter 評価版のお申し込み
から、お申し込みください。

アンテナハウスではPDFの生成、読み込み、編集、表示ライブラリーを自社開発ライブラリーとして保有しています。こうした基本技術や製品をお客様のシステムに組み込む受託の開発も行っています。お気軽に、お問い合わせ下さい。

OEM


用途に合わせた製品選びを -その3-

用途ごとに製品をご紹介していますが、最終回は次のような用途の製品です。

主な用途

  • PDFに文字を追記したい
  • PDFに画像を挿入したい
  • PDFに印鑑を押したい

このような用途を満たす製品は次の製品です。
瞬簡PDF 書けまっせ

「瞬簡PDF 書けまっせ」はPDFファイルに文字を追記できる製品です。
文字を追記したい場所にテキストボックスを作って文字を入れるため、PDFのどの位置にでも自由に文字が追記できます。
また、計算式や画像ファイルを挿入したり、印影を作成して挿入するなど機能も充実。
Excelのデータを差し込むといったこともできるため、確定申告の書類などを作成するのにも向いています。

「瞬簡PDF 書けまっせ」のよくある質問

用途に合わせた製品選びということで3回に分けて紹介しましたが、製品によって、ご紹介した以外にも様々な機能を搭載しています。
製品の詳細はWebサイトにも記載がありますので、製品ご購入の参考にしてみてください。
なお、複数の用途で使用されたいお客様には全ての製品が入った「瞬簡PDF 統合版」をお勧めいたします。

また、「製品ナビゲーター」では、用途にあった製品を探すことができますのでご参照下さい。

<< 用途に合わせた製品選びを -その2-


用途に合わせた製品選びを -その2-

用途ごとに製品をご紹介していますが、第2回目は次のような用途の製品です。

1.主な用途

  • PDFファイルをWordやExcelで編集したい
  • PDFからテキストや画像を取り出したい

2.用途を満たす製品

「瞬簡PDF 変換」はPDFファイルをWordやExcelに変換できる製品です。
PDF内に文字情報が入っていれば文字化けすること無く変換可能。
スキャナ等で作成した文字情報の無いPDFの場合、OCR機能で文字を読み取りWordやExcelなどへ変換することができます。
また、PDF内のテキストや画像を取り出したり、OCRで読み取った文字情報をPDF内に埋め込むといったこともできます。

「瞬簡PDF 変換」のよくある質問

用途に合わせた製品選びを -その3- >>


用途に合わせた製品選びを -その1-

アンテナハウスの瞬簡PDF シリーズにはPDFを有効に利用するための様々な機能が搭載されています。 しかし、製品によって使用できる機能が異なるため、間違って本来の用途と異なる製品を購入されてしまうお客様がいらっしゃいます。
そこで用途に合わせた製品選びができるように3回に分けて製品を紹介したいと思います。

1.主な用途

  • PDFを作成したい
  • PDFのページを分割したい
  • 複数のPDFファイルを結合したい

2.用途を満たす製品

「瞬簡PDF 作成」は文字通り、PDFを作成する機能を搭載した製品です。
この製品では様々なアプリケーションからPDFを作成したり、既にあるPDFのページを分割したり、複数のPDFファイルを結合することができます。
また、PDFの中から特定のページを抽出したり、PDFにセキュリティを付加することも可能となります。

「瞬簡PDF 編集」はPDFの編集機能を搭載した製品です。
様々なアプリケーションのファイルからPDFを作成したり、PDF内のページを自由に抜き出し、別のPDFに再構成するといったことができます。
また、PDF内に文字情報が入っていれば文字の編集を行う事もできます。
その他にもPDFに注釈を挿入したり、ページ番号を付加するといったことも可能です。

「瞬簡PDF 作成」のよくある質問
「瞬簡PDF 編集」のよくある質問

>> 用途に合わせた製品選びを -その2-


ファーウェイ等禁止の話

少し前の話ですが、2019年度米国防権限法(NDAA2019)が成立したため、2020年8月13日以降、ファーウェイやZTE等の製品を使用していると 米国政府機関と契約(contract)できなくなります。

詳細は、
https://www.congress.gov/bill/115th-congress/house-bill/5515/text
の SEC. 889. を確認してください。

「contract」と「entity that uses any equipment, system, or service」の範囲が難しいです。

米国ビザの取得やESTA申請は米国政府との「contract」にあたるのでしょうか?
法人でファーウェイ等製品を購入使用している場合はNGでしょうが、代表権を持つ役員が私費で購入し完全にプライベートのみでしか使っていない場合は?
従業員の私物だが、業務連絡に使っている場合は?

米国法の専門知識がないと皆目見当がつきません。
そうなると目に付くファーウェイ等製品は片っ端から破棄するしかないのかもしれません。

ファーウェイ等製品の所有者が観光で米国内の国立公園や博物館への入場することや、 米政府機関Webサイトのプライバシーポリシー等にOKすること、日本国内の米軍基地イベントへの訪問も 違法行為になるのかもしれません。

ファーウェイ、ZTEの製品は今でも普通に購入できるので、個人レベルでもそこそこの問題なはずですが ネット上でもソフトバンクの5G機器の話以外の情報はほとんどありません。


Windows小噺三題

Windowsの検索に困惑する

Windows Vista以降、Explorerの検索ボックスでのファイル検索で、日本語のファイルが見つからないことがそれなりに頻発するのはもうどうにもならないのだろうか。少なくともそこにあるファイルを確実に見つけ出すことは可能だろうか。
困ったことに、この検索の正式な仕様は完全には公開されていない。マイクロソフトの仕事としては珍しく何故か徹底的に曖昧だ。きわめて断片的だが以前は多少情報を掲載しているページがあった。「ファイルが見つからない理由」とか「Windows での検索の高度なヒント」。タイトルからも判るように、網羅的な仕様ではなく、しかも日本語の問題は一切触れていない。で、数少ない情報も現在はリンク切れ。どうもマイクロソフトはExplorerでファイルを探して欲しくないようだ。
以前読んだ上記二つの記事から「予想・類推」できるのは、どうやら検索のメタ文字と分析のセパレータ文字が存在するらしいこと。そして、その二種類の文字を検索対象にするにはエスケープが必要らしいこと。しかし、メタ文字とセパレータ文字を網羅した一覧がない。いやその記事に書いてあったんじゃないかと思うかもしれないが、それらの文字をいわゆる全角にした文字も含むなんてどこにも情報がない。そう、「~=<>!”」に加え、少なくとも「~=<>!“”」がメタ文字として扱われているように検索機能は振舞う。そして、「 .-_$()[]{}\/」がセパレータ文字とされているが、いわゆる全角文字のどこまでセパレータ文字なのか一切不明だ。経験で「・」とか「☆」がセパレータ文字扱いされているらしいと想像しているが、そんな情報は一切マイクロソフトからは提供されていない。
そんなわけで、「コンプレックス・シティ.txt」というファイルを探すときは「コンプレックス・シティ」で見つかるが、「究極超人あ~る.txt」というファイルを探すときは「究極超人あ~る」ではなく「”究極超人あ~る”」と入れなくてはいけない。「・」は単なるセパレータだが「~」はメタ文字なので、なんらかの命令として解釈しようとするようだ。
メタ文字やセパレータそのものを検索対象にするには「~=”~”」だとか「~=”・”」になる。これで見つからない原因の一部は対処できるが、Windowsが勝手に分解した単語での検索なので、「ルパン三世.txt」が「パン」で見つからないことには「*パン」で対処する必要はある(これは割と知られている情報だと思う)。さいわい「*」はファイル名には使えない文字なので「*」を検索対象にすることはない。
日本マイクロソフトさん、ある程度はこのへんの情報をヘルプに書いておいてくれませんか。「Explorerの検索ボックスは使い物にならない」と日本で判断されている最大の原因は、日本語検索関連の仕様が一切公開されてないことにありますよ。予想とか類推とか想像とか本来全く不要なことです。

Windowsのタッチキーボードに困惑する

Windows 10にはタッチキーボードがある。デスクトップでも使える。キーボードなしのタブレットとして使うには必須の機能だ。タブレットのWindowsなんてのは非常にマイナーなのでタッチキーボードなんて知らない人も多かろう。でも私は結構頻繁に使う。でも使ってる人が少なく、しかも日本語版はおそらくマイクロソフトですら使う人が少ないためか、「カタカナに変換する」という結構重大な機能が見つからない。Webで検索すると『日本語入力中はボタンが[カナ英]に変わります。[カナ英]をタップするとカタカナに変換できます。』と書いてあるページがあるのでカタカナに変換する機能はかつてはあったらしい。いつのまにやら[カナ英]にならなくなってしまったようだ(デグレ?)。それとも[カナ英]になるための何か別の条件でもあるのか? なんにせよ、この日本語向けタッチキーボードの取扱説明書が必要でしょう。Windows 10って取扱説明書はないんですか? マニュアルは存在しないんですか? 日本語入力周りの正式な方法の説明が読みたい。切実に読みたい。日本マイクロソフトさん、以下略。

Windowsのフォントサイズに困惑する

Windows機が次々にアップデートされて新バージョンになっていく。別にアップデートは構わないのだが、駄目だろって変更があった。システム既定の文字サイズを変更できなくなった。Explorerの文字サイズが変えられない。アプリケーションのメニューの文字サイズが変えられない。別にフォントフェースは何でもいいのだけど、老眼にはこの文字サイズは耐えられない。なんで時代が進むにつれて表示される文字サイズが小さくなるんだか。デザイン上綺麗に見せるためだかなんだか知らないがメニューとExplorerのデフォルトの文字サイズがそもそも小さい(Windows 3.1なんかはむしろ大きすぎたけれど)。Windows 3.1のスクリーンショットを現在主流の23インチHDモニタで表示しても、今のデフォルトの文字より大きい。当時主流のモニタの解像度を勘案するとさらに大きかったわけだ。
今までは変更できたから問題なかったわけだが、何を考えて変更するUIを無くしてしまったのだろう。無くしたらどういう影響が出るのか思い付きもしなかったってことだろうか。この決定をした人はいくらなんでも想像力が無さすぎ。アクセシビリティーに関して確実に後退している。パーソナルコンピューターってのは1990年代以降文字サイズの変更程度のことは簡単にやれて当然なものだったはずなんだが、なんでこうなった。その後何度かバージョンが上がったが、結局文字サイズの変更は復活してない。
決定した人は漢字文化圏のことなんて一切考慮してないだろうなと思い至った。あぁ、viが8bitスルーじゃなかった頃から問題の本質は変わってないってか。


『Office Server Document Converter』OpenXMLSDKでマージしたdocx(Word)文書の対応

現在のOffice Server Document Converter(OSDC)(V7.0)はマージされたWord文書に対応していません。ユーザからの要望がありマージされた文書への対応を検討しています。

Word文書内のwordフォルダはいくつかのxml文書で構成されています。

document.xml 本文
fontTable.xml フォント
settings.xml セッティング
style.xml スタイル
footer1.xml フッタ
header1.xml ヘッダ
footnote.xml 脚注
endnote.xml 文末脚注
numbering.xml 箇条書き設定

などです。
OpenXMLSDKでマージした文書にはこのwordフォルダ内にマージされたWord文書がそのまま入っています。

afchunk1.docx

このdocxファイルの参照は本文中にある<w:altChunk>から行います。

 <w:altChunk r:id="AltChunkId0"/>

ファイル_rels/document.xml.relsからr:idに対応する文書を得ます。

 <Relationship Type="http://schemas.openxmlformats.org/officeDocument/2006/relationships/aFChunk" Target="/word/afchunk1.docx" Id="AltChunkId0" />

これで、マージされたWord文書(Target=”/word/afchunk1.docx”)を得ることができます。

このファイルはWord文書そのものです。

<w:altChunk>というエレメントはBlock要素です。

 <xsd:group name="EG_BlockLevelElts">
    <xsd:choice>
      <xsd:group ref="EG_BlockLevelChunkElts" minOccurs="0" maxOccurs="unbounded"/>
      <xsd:element name="altChunk" type="CT_AltChunk" minOccurs="0" maxOccurs="unbounded"/>
    </xsd:choice>
  </xsd:group>

Block要素としては<w:p><w:tbl>などがあります。
これらの要素と同じように処理すればマージした文書になるはずです。

<w:p/><w:p/><w:p/>
<w:altChunk/> ここにマージ文書を挿入する
<w:p/><w:p/><w:p/>

document.xml内は

<w:document>
 <w:body>
  <w:p/>
  <w:p/>
  <w:tbl/>
  ...
  <w:p/>
 </w:body>
</w:document>

のように並んでいます。
マージするとき、 <w:document><w:body>の処理を行えば、内部は外側の文書と同じBlock要素として処理できます。問題は、あくまで別文書として処理しなければいけない。外側と、内部文書では参照するファイルが異なります。style.xmlなどは独立した設定になるはずです。

OSDCでは <w:altChunk>で指定されたWordファイルから新しいdocumentクラスを作成する。
documentクラスからページ作成を継続する。
documentクラスの処理が終了したら親のdocumentの<w:altChunk>に戻り処理を継続する。
このような実装を行っています。

今後も要望などを検討しよい製品にしていきます。


Antenna House PDFXML ライブラリ V3.0』鋭意開発中

『Antenna House PDFXML ライブラリ』は、PDFファイルの内部データを、XML(Extensible Markup Language:拡張可能なマークアップ言語)形式に変換するプログラムです。
このライブラリが出力するXML形式を「AHPDFXML形式」と呼びます。PDF解析技術により文書構造を生成して、再利用に適したXMLデータを出力します。

公開バージョンは『Antenna House PDFXML ライブラリ V2.0 MR2』2018年6月28日リリースです。
次期バージョンは『Antenna House PDFXML ライブラリ V3.0』です。リリース時期は2019年2月中となっております。
旧バージョンと比較して、表などの解析精度が大幅に改善しています。

XMLで表現することによって、データの扱いが容易になります。
XMLのメリットを最大限に活かしてPDFデータを活用できます。
弊社ウエブサイトより評価版の申し込みが可能です。是非ご評価ください。

製品に関するご質問は
sis@antenna.co.jp(SYSTEM担当)
または
oem@antenna.co.jp(OEM担当)
まで、お気軽にお問い合わせください。

評価版のお申込
評価版のお申込ページ

Webページ
https://www.antenna.co.jp/pdfxml/


Pages: 1 2 Next