CAS-UB にデジタル出版機構様の Picassol のXML のインポート機能を追加!

弊社で開発したクラウドサービス「CAS-UB」の「外部データの入力」機能に、新たに出版デジタル機構様が開発した「Picassol」で整理済みのXMLファイルをインポートする機能を追加しました!

「Picassol」とは、(株)講談社と日本電気(株)が共同開発した高機能編集プログラム Smart Source Editor(スマート・ソース・エディター、以下SSE)をクラウドサービス化したもので、文章の構成や校閲、ルビ付けなどをクラウド上で自動で再編集することも可能です。(公式サイトより引用 http://www.pubridge.jp/picassol/)

保存形式ファイルは、XMLファイルで採用しており、紙媒体、電子媒体向けに汎用性高く扱う事ができ、また、XML内のタグもわかりやすく構成されており、タグを再構成することで、Webページとして扱う事もできます。

今回追加した機能は、その「PIcassol」の整理済みXMLのファイルのタグの情報を元に読み込み、CAS 記法に書き換えて出版物の記事としてインポートする機能になります。
主な特徴として、まず、「Picassol」で編集した文章を大まかなスタイルと合わせてそのままインポートする事ができ、インポート時は、見出しレベル章(レベル1)、節(レベル2)、項(レベル3)ごとに記事をツリー構造の状態で分割することができ、また、その分割するレベルも選択することが可能です。さらに、文字列に添えた注釈とその注釈の内容、ルビもそのまま反映されます。

機能につきましての詳細は、以下になりますので、是非利用してみて下さい!!
http://www.cas-ub.com/outline/picassol-import.html




瞬簡PDF 編集 2024
かんたん操作でPDFを自由自在に編集


瞬簡PDF 変換 2024
PDFをOffice文書へ高精度変換

DLLを作るときの注意事項

WindowsでDLLを作るときには注意事項がいろいろあります。
どの言語で開発するかを問わず必ず問題になるのは、

  • 呼び出し規約
  • DLLヘル
  • メモリの確保と解放
  • 構造体のパディング
  • 例外
  • スタックサイズ
  • FPU制御レジスタ、MXCSRレジスタ

くらいでしょうか。

C++の場合は更に、

  • STLの公開と非互換性
  • クラスの公開
  • オーバーロード

などが追加されます。

ネット上でこれらの問題と解決法(諦めることも含めて)を見つけることはできますが、「FPU制御レジスタ、MXCSR」についてはDLLと絡めた情報は見つかりません。

FPU制御レジスタ、MXCSRレジスタの設定値はコンパイラによって変わります。
FPU制御レジスタの初期値はVCでは0x027f、VB6は0x137f、Delphiは0x1372で全て値が違います。実行中に変えることもできます。
DLLは自分の呼び出し元がどれで作られているかは関知しないので、制御レジスタがどんな値でも対応できなければなりません。

基本的には公開関数の最初で制御レジスタを都合のいい値に変更し、最後で呼び出されたときの値に戻せばOKです。
関数からEXE側にコールバックする等、モジュールを越える場合は都度対応が必要です。

この問題はわかりにくい形で発生します。
以前弊社で利用したOCRライブラリではDelphiからの呼び出しで認識精度がガタ落ちしました。
また弊社PDFDriverに対して16bitのVBアプリからの印刷で例外が出ることがありました。
いずれもFPU制御レジスタの設定で解消できましたが、OCR問題の時はこれを知らなかったのでかなり解決に時間がかかりました。

EXE制作で外部のDLLを利用する場合に、サンプルコード通りなのに結果がおかしい、VCからならOKなのにVC以外からだと同じ入力でも結果が違う、という問題がおきたらFPU制御レジスタを変えると期待通りの動作になるかもしれません。

VCではFPU制御レジスタの初期値は0x027f、MXCSRレジスタの初期値は0x1f80です。




瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品!


瞬簡PDF 作成 2024
ドラッグ&ドロップでPDF作成

Microsoft Edge で PDF ファイルを扱いにくい

以前、「Windows 10 では Microsoft Edge の一機能として PDF 表示が行えるようになっています。」と紹介しました。
Windows 10 の PDF 表示機能

Microsoft Edge には、実際に Edge アプリを起動したあとでは PDF ファイルを開こうとしてもできない、という奇妙な制約があります。

PDF ファイルを Edge のウィンドウにドラッグ&ドロップしても受け付けられず、 ローカルファイルの一覧を表示して開くファイルを選択できるようなインターフェースもありません。

Edge で PDF を開くためには、PDF ファイルの関連付けアプリを「Microsoft Edge」に変えてからエクスプローラー上でファイルを開く操作をするか、
kanrenduke
エクスプローラーの右クリックメニューで「Microsoft Edge」を選ぶという操作が必要になります。
explorer-menu

 

ドラッグ&ドロップでファイルを開けないのは、今まで Windows を使ってきた経験上、かなり不便に感じます。
何か理由があってドラッグ&ドロップ操作は禁止されているのかもしれませんが、筆者の使っている他の PDF 閲覧アプリ(下記)ではそのような制限はありません。そのため筆者の普段使いのリストからは Edge は外れています。
—-
Addobe Acrobat Reader DC
PDF-XChange Editor
Google Chrome
—-

IE11 で PDF のドラッグ&ドロップでの表示が可能か試してみると、それは可能でした。
ただ、筆者の環境では Acrobat Reader のアドオンが使用されていて、Edge のコンポーネントが使用されるわけではありませんでした。
これでは、Acrobat Reader DC を単体で利用するのとあまり変わりません。
ie11-pdf




アウトライナー
PDFを解析して しおり・目次を自動生成


瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識

プログラミング小噺三題その2

Objective-Cに嵌る

Objective-CはCの系列なのでクラスを宣言するヘッダファイル(.h)とクラスを実装するソースファイル(.m、.mm)がある。同期通信を非同期通信に置き換える改造(元は私のコードではない)で、色々書き換えてるうちにどうにも全く動かなくなった。以下、クラスの宣言はヘッダファイルでする必然性はないが、機能のモジュール化等の現実のプログラミングの流儀を前提とした話なので、クラスの宣言=ヘッダファイル、ということで了承願いたい。

詳細に調べて判明したのは、ヘッダファイルにメソッドの宣言があって、ソースファイルに実装がなくてもXcodeではビルド・サクセスとなり、リンクエラーにはならないということだ。C++はオブジェクト指向言語としては偽物なので、存在しないのに呼ばれてるメソッドはリンクエラーになるのだが、Objective-Cはメソッド呼び出しがきちんとダイナミックになってるので実行時に解決することになる。で、解決できないとどうにも全く動けない。

問題のソースファイルをコンパイルするとちゃんとWarningが出ていた。ヘッダファイルに書いてあるメソッドが見つからないぞと。綴りが間違ってた。Objective-Cはヘッダファイルに宣言のないメソッドはクラス内でのみ使える、C++でいうところのプライベート扱いになる。それが仇になった。綴りを間違えたメソッドは正当にプライベートメソッドになっていた。C++だとプライベート(クラス内でのみ呼べる)だろうとパブリック(どこからでも呼べる)だろうとヘッダファイルに書かないといけないので、綴りの間違いはそもそもコンパイルエラーになる。Objective-Cはヘッダファイルに記述することなく自由にプライベートメソッドを書ける、すなわち再コンパイルが発生しにくいという、マシンパワーが貧弱(最初のNeXTはMC68030)な時代の要請が言語仕様に反映されており、コードの改造には微妙に不便だと再認識した。わざとコンパイルエラーを発生させてそこの記述を書き換えるというのが昔ながらの常套手段だからだ(なので、LLで書かれたプログラムの改造は勘弁して欲しい)。そういえば以前も同じように綴り間違いで慌てたことがあるのを思い出した。

AppleのAPIリファレンスに憤る

AppleのAPIリファレンスのページでNSURLSessionを調べる。downloadTaskWithURLメソッドをブラウザのページ内検索で探す。見つからない。目で探すとある。まさかとdownloadTaskWithURLを選択してコピー、テキストエディタにペーストするとdownload Task With URLとなる。アチャァ。しかも単なる空白が埋められてるのでなくU+200Bだ。ゼロ幅スペースだよこれ。これ決めた人はプログラマに恨みでもあるんですか? 頭おかしいザマス。Appleの製品向けにプログラムなんて作るなってことかいな。
Firefoxでは見つからないがSafariでは見つかる。Edgeでは見つからないがChromeでは見つかる。WebKit系の方が優秀ですよとでも言いたいのか。downloadTaskWithURLとdownload Task With URLは違うだろ、メソッド名は分解して良い何かではない。

OCamlnetに落胆する

「OCamlnet Http_client」でWeb検索すると、Http_client.Convenienceを使ってみた系の頭の悪い話ばかりでウンザリする。Cookieをセットしたりとか細かく制御したいからプログラムを書くんであって、Http_client.Convenienceでは仕様が大雑把過ぎて使えない。まだしもwgetの方が色々できる。
Http_clientの使い方はHttp_client.pipelineが関係してることまでは突き止めた。つうかマニュアルのHttp_client.pipelineのところにExampleが書いてある。ダウンロードのプログレスを出したいんだが、どうもよく分からん。プログレスが出せないならHttp_client.Convenienceでも同じ。

OCamlnetを調べて判ったのは、ダウンロードするときにどのくらい済んだのかの経過を表示したい、という私の目的はちょっとやそっとでは達成できないらしいこと。OCamlnetはなるほど壮大なフレームワークのようで、色々取り揃えているようだ。だが、ガイドの説明にて「The Netchannels tutorial – strongly recommended read!」なんて書いてあるから読んでみたが、単に独自のI/Oデスクリプタの説明だった。Http_clientを調べてる私には一切無関係。
単にhttps接続されたWeb上のファイルをダウンロードしたいだけだってのにpipelineやらcontextやらtransportやらequeueやらengineやらあまりにも普通名詞過ぎて意味不明な独自概念が目白押し。あぁ、なんだ、世界系だったのか。こういうのチマチマ構築するのって楽しいんだろうなぁ。結局経過表示をする方法は発見できなかったわけで、縁があったらまた会いましょう、さようなら。せめてPythonのurllib2とか.NETのWebClientくらいに扱いやすければ文句もないんだが。

結局自分でUnix.socketを使って書いたHTTP GETをするコードを元に、Socket通信をOCamlの外部ライブラリのSslに置き換えることで実現。さらにはファンクターにして、httpとhttpsでコードを共有した。C++なら仮想関数で実現するようなことはOCamlではファンクターで合ってるんだろうか。五十嵐淳さんの入門書に「一部だけ異なる似たようなモジュールを何度も書く面倒をなくし」とあるから多分合ってるんだろう。




アウトライナー
PDFを解析して しおり・目次を自動生成


瞬簡PDF 編集 2024
かんたん操作でPDFを自由自在に編集

「Antenna House AHPDFXML 変換ライブラリ V2.0」の利用例

「Antenna House AHPDFXML 変換ライブラリ V2.0」は、PDFファイルの内部データを、XML(Extensible Markup Language:拡張可能なマークアップ言語)形式に変換するプログラムです。このライブラリが出力するXML形式を「AHPDFXML形式」と呼びます。PDF解析技術により文書構造を生成して、再利用に適したXMLデータを出力します。

「AHPDFXML形式」で表現された様々な情報から、必用な情報を読み取ることでPDFのデータを簡単に再利用できます。

  • 文字や画像の位置情報を利用することで、任意の範囲に含まれるデータを取り出せます。
    例えば、アンケートに使用したPDFの回答欄の文字列だけ取り出すことができます。
    例えば、特定の文字列や画像を含むPDFを探すことができます。
  • 表構造をデータベースに取り込むことにより、データのグループ化がおこなえます。
    PDFには表と言う概念はありませんが「AHPDFXML形式」は、表構造(行列及びセル)を生成します。
    これにより、文字としてでは無く、表としてデータを再利用できます。
    例えば、表構造をCSVに落とすことにより、表計算ソフトに取り出込めます。

XMLで表現することによって、データの扱いが容易になります。
XMLのメリットを最大限に活かしてPDFデータを活用できます。
弊社ウエブサイトより評価版の申し込みが可能です。是非ご評価ください。

製品に関するご質問は
sis@antenna.co.jp(SYSTEM担当)
または
oem@antenna.co.jp(OEM担当)
まで、お気軽にお問い合わせください。

評価版のお申込
評価版のお申込ページ

Webページ
https://www.antenna.co.jp/pdfxml/




瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識


アウトライナー
PDFを解析して しおり・目次を自動生成

「Antenna House AHPDFXML 変換ライブラリ V2.0」の概要

「Antenna House AHPDFXML 変換ライブラリ V2.0」は、PDFファイルの内部データを、XML(Extensible Markup Language:拡張可能なマークアップ言語)形式に変換するプログラムです。このライブラリが出力するXML形式を「AHPDFXML形式」と呼びます。PDF解析技術により文書構造を生成して、再利用に適したXMLデータを出力します。

PDFのデータは、文字、線、画像などが配置されているだけで、文字は見た目順に格納されているとは限らず、段落や表と言う概念もありません。本ライブラリでは、PDFのデータを単にXML化するだけで無く、文書構造を生成して、再利用に適したXMLデータを出力します。「AHPDFXML形式」として出力される主な情報は次の通りです。

  • 段落、行、パラグラフなどの文書情報を生成。
  • 線画情報から、水平/垂直の線分を抜き出して、表構造(行列及びセル)を生成。
  • 文字を見た目順に再配置してから出力。
  • 文字情報は、位置、フォント情報などを出力。
  • 画像情報は、位置、種別などを出力。
  • 画像本体は外部ファイルとして出力。

XMLで表現することによって、データの扱いが容易になります。
XMLのメリットを最大限に活かしてPDFデータを活用できます。
弊社ウエブサイトより評価版の申し込みが可能です。是非ご評価ください。

製品に関するご質問は
sis@antenna.co.jp(SYSTEM担当)
または
oem@antenna.co.jp(OEM担当)
まで、お気軽にお問い合わせください。

評価版のお申込
評価版のお申込ページ

Webページ
https://www.antenna.co.jp/pdfxml/




HTML on Word
WebページをWordで作る!


瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識

CAS電子出版新刊ご紹介『投資信託による資産運用のイロハ』(初版)

本書は副題に「毎月分配型を中心に」と付けているとおり、毎月分配型の投資信託による資産運用の方法についての基本原則を整理したものです。

書誌情報
・書名:「投資信託による資産運用のイロハ」初版
・出版社: アンテナハウスCAS電子出版
・発売日:2017年7月
・著者:小林 徳滋
・発行形式:プリントオンデマンド版 なし
・発行形式:電子版アマゾンKDP(アマゾンへ)
・価格(税込):250円
・ISBN:978-4-900552-51-7

毎月分配型投資信託は分配金を毎月計算して支払うというタイプの投信です。その対極は分配金の支払いのない投信です。

弊社の資産運用の中核はこの毎月分配型投資信託になります。もちろん、それ以外の投信などもミックスしていますが、毎月分配型投資は資産運用の方法としては低リスクであると同時に、場合によっては利益を出すことができる、という点で優れた方式になり得ると考えています。本書のなかでは具体的なことはあまり触れずに、原理原則を整理してみました。

本書は実践の中で考えたものをまとめたものであり、評論ではなく真剣勝負の話です。これを電子書籍として公開しましたのは、毎月分配型投資信託の良さをもう少し見直してもらう必要があると考えたからです。

Webの記事では、毎月分配型投資信託に対する非常に強い批判がよく見られます。
例えば、「毎月分配型投信「第4世代」のひどすぎる手口

また、最近、金融庁長官が毎月分配型投資信託を資産形成に不向きと批判したとかで、顧客離れが起きているようです。
「毎月分配型投信、初の資金流出 金融庁批判受け上期」

毎月分配型投資信託の批判の第一は、毎月の分配金の中に元本を取り崩して払っている部分が含まれる場合が多いということです。これは確かにそういう部分もあります。これが行きすぎると基本価格の大幅な下落に繋がりますので良いとは言えません。しかし、考えようによっては儲からないときは毎月元本を返してくれるだけでも良心的です。投資の中には元本も帰ってこないで紙切れになってしまうケースもあり、例えば、上場会社の破産で株式が紙切れになってしまうことも珍しくないのですから。

もう一つの批判は収益を毎月分配してしまっては複利効果が得られない、というものです。長期投資は複利効果を生かして大きくすべきという主張なのですが、だいたいこういう議論では銀行預金で単利と複利を比較します。しかし、銀行預金は元本保証ですが、投資では元本保証がありません。投資信託では元本にあたるのは基準価格ですが、これはかなり大幅に変動します。そして、シミュレーションをしてみれば直ぐに分かりますが、基準価格が一定あるいは上昇する局面では複利が単利より有利、しかし、基準価格が下落する局面では複利は単利より不利なのです。元本自体が大幅に変動する世界に元本保証の世界の話を持ち込む論法には疑問を感じます。

投信に限らず、多くの場合、投資で利益をだすには安く買って高く売ることです。しかし、実際にはこれがほとんど実行できないのです。例えば、次の運用成績図をご覧ください。

この投信は毎月分配型ではありません。従って、この投信によって利益を出すには安いときに買って高く売るしか方法がありません。そして、ご多分にもれず、リーマンショックで投信の基準価格が大幅に下がっているのですが、これがリーマンショックの前の水準に戻るまでに5年近く掛かっています。つまり、もし、リーマンショックの前に購入したら、5年間はただひたすら待つしかないのです。2017年に振り返れば5年待てば利益が得られると分かるのですが、しかし2010年にいたらいつまで待てば良いのか全く分かりません。そうしますと、信じて待った人だけが救われる、ということになってしまいます。こうなりますと、ほとんど宗教と同じではないでしょうか。

毎月分配型であれば、元本が少しずつでも戻ってきます。毎月元本の1%が戻ってくれば百ヶ月=約8年で全部戻ってくると予想できますので、仮に運がなくてマイナスの局面になってしまったとしても待ちやすいといえるでしょう。

運良くプラスの局面になったら、もちろん全部売って利益を出すことができます。




瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品!


瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識

XSLT と XSL-FO の勉強会(XSLSchool)

XML を自動組版するには XSLT の開発と XSL-FO の知識が不可欠です。HTML と CSS で組版しようという動きもあるにはありますが、まだまだ少数派でしょう。

弊社では XSLT と FO の両方を1日で学んでしまおうという、ちょっと贅沢なセミナーを開催しています。今まで25回以上開催し、ご参加者の延べ人数は100名様を超えてます。「XSLT や FO は名前を聞いたことはあるけれど…」という方々からご好評をいただいているセミナーで、6~7時間かけて XSL-FO の基礎を学びながら XSLT をひたすら入力していただく、ちょっとしたスパルタな内容です。

school-text

セミナーで使うテキストの一部

今月は12日と13日に二日連続で開催しました。二日連続というのは今までになかったかもしれません。講師はへとへとです(^^; が、皆さんに満足していただき、うれしい限りです。

詳しくは 「XSLSchoolのご案内」 をご参照ください。




アウトライナー
PDFを解析して しおり・目次を自動生成


瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識

DITA で WebHelp を作る

マニュアルを制作するにあたり「PDFよりもHTMLを優先したい」という声が最近増えて来ました。自動組版エンジン AHFormatter を開発している弊社としては、あまり面白くない話なのですが(笑)時代の流れには逆らえません。

タブレット端末やスマホがここまで浸透した今、固定レイアウトの PDF や紙マニュアルよりもリフロー型の HTML の方がニーズにマッチしているのでしょう。弊社でもレスポンシブな HTML の作成方法についてすでに研究を開始していますし、弊社の WEB サイトのレスポンシブ化もほぼ完了しています。

とは言え「紙マニュアルは絶対に必要。停電したときでも読めなければいけない。紙は最後の砦」このような、とあるプラントメーカー様の声もあります。

さて、そんな昨今ですが、DITA コンソーシアムジャパンの中に「DITA for WebHelp 研究部会」というものが立ち上がり、7月5日に最初のミーティングが行われました。

  • DITA から作成した WebHelp の実態を調査し、課題を明確にする
  • DITA から使い易い WebHelp を作るためのガイドラインを作成する
  • DITA から WebHelp 変換のプロトタイプを開発する

このような目的を掲げています。どのような研究成果が得られるか楽しみです。

CIDM(コンテンツマネジメントと情報開発のベストプラクティスに焦点を当てた会員組織)の調査によると、今年ついに HTML パブリッシングの方が PDF パブリッシングよりもわずかに多くなったようです。
この流れは確実に大きくなりますね。




瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品!


瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識

Office Server Document Converter V6.1、Web Interface for OSDC 海外販売計画推進中

海外営業担当2です。

先日、国内向けのOffice Server Document Converter V6.1リリース情報が ブログ にアップされましたが、海外営業グループでも英語版リリースの準備を進めています。
国内に比べて、苦戦している欧米の市場ですが、この新製品リリースを契機に販売攻勢をかけるべく、アメリカ事務所のメンバーと共に日々格闘しています。(もちろん日本チームの強力なサポートあってのことですが)

9月にはテキサス州、オースチンでの展示会(SDxE: The Software-Defined Enterprise Conference & Expo  9/25~27開催 )に出向き、製品アピールと共に、市場ニーズの調査を行う計画です。
もしお知り合いで出店、来場される方がおられれば、ぜひお声がけをお願いします。

日本国内のユーザー様にももっと良い製品をお届けできるヒントを得られれば、と少し欲張った事も考えていますので、アメリカ出張の成果を後日報告出来るよう、頑張って参ります。

製品紹介サイト(英語)
http://rainbowpdf.com/about-us/
https://www.antennahouse.com/antenna1/




瞬簡PDF 作成 2024
ドラッグ&ドロップでPDF作成


HTML on Word
WebページをWordで作る!
Pages: Prev 1 2 3 ... 76 77 78 79 80 81 82 ... 230 231 232 Next