カテゴリー別アーカイブ: 構造化文書

【SODEC2020春】第29回ソフトウェア&アプリ開発展 に出展【2020/03/23追記 開催延期のお知らせ】


2020年4月8日(水)〜10日(金)に東京ビッグサイトにて開催予定でした「第29回 Japan IT Week春」は、開催延期となりました。

「第29回Japan IT Week春」開催延期のご連絡 – Japan IT Week 事務局
以上2020/03/23追記


2020年4月8日から開催される「第29回 ソフトウェア&アプリ開発展【SODEC2020春】」にアンテナハウス株式会社は出展致します。

例年は5月開催のところですが、オリンピックの関係で開催時期が1か月早まりました。
今年は春の訪れも早いようなので、いつもより少しだけ厚着でと出展の準備をしてきましたが、ご存じのような事態となっています。
「自粛」「辞退」と気持ちは揺れるところですが、ひと月先は誰にも予測できない状況であれば、
予定通りの開催を前提に粛々と準備を進めるだけと決め、出展のご案内をいたします。

今年も目玉は「PDF技術」。
PDFの作成から閲覧や加工・編集、そしてPDFの再利用を目的としたツールをご紹介いたします。
PDFは様々なドキュメントから変換して閲覧できることで普及してきましたが、それだけではありません。
くっつけたり離したり、書き込んだり取り出したりとお望み通りの加工・編集が可能です。
こんなことが出来ないかなとか、出来たらいいなといったご要望があればご相談に乗ります。
また、もうひとつの目玉として、ドキュメント作成の「省力化による働き方改革」を目的とした「自動組版」の提案です。
XMLなどの構造化文書の作成や大量の文書変換などのお手伝いをいたします。
ぜひともアンテナハウスブースへお立ち寄りください。

■ ご紹介製品

  • PDF Tool API
    ページ結合・分割、しおり・注釈編集などのPDF 加工機能を行うAPIです。
    ブラウザからの呼び出しで利用できるデモを会場で実施します。
  • AH Formatter
    今年20周年を迎え、2月に新バージョンを発売したXML自動組版エンジンのパイオニアです。
    日本語組版など多くの拡張機能により商品レベルの書籍組版ができます。
    また、多言語のドキュメントを大量に高速処理することで、組版の省力化を実現します。
  • Office Server Document Converter
    Microsoft Officeがインストールされていない環境でも、Word/Excel/PowerPoint等の文書をPDFや各種画像ファイルへダイレクト変換するライブラリです。
    パブリッククラウドでオフィス文書の変換を検討している皆さん、ライセンス問題はこれで解決です。
  • PDF Driver
    GDI 型の仮想プリンタドライバと、これを制御する付属APIのセット製品です。
  • PDF Server
    サーバ上で画像データやMSOffice文書からPDFを生成し、イントラネットで配信したり、各種グループウェアへ自動登録を行う開発不要のサーバソリューションです。
  • PDF Viewer SDK
    PDFの表示と編集の専用アプリケーション開発用ライブラリです。

■ 展示会詳細とアンテナハウスブース

会期: 2020年4月8日(水)~4月10日(金)
10:00~18:00(10日のみ17:00終了)
場所: 東京ビッグサイト 西展示棟
★アンテナハウスブース: 西 9-31

さて、新型コロナウイルス関連肺炎について、主催事務局ではWHO(世界保健機関)および厚生労働省のガイドラインに沿って対策を実施します。

3月3日現在予定している会期中の対策は、以下の通りとなります。

  • 出展社及び来場者に対してマスク着用のお願い
  • 全入口ゲートに手指消毒液を設置
  • 全入口ゲートでサーモグラフィーによる体温測定を実施
    37.5度以上の場合、問診票への記入を実施し、医師または看護師との面談の上、入場をお断りする場合がございます。
  • 咳エチケットと頻繁な手洗いを奨励する看板の設置
  • セミナー会場の入口を常時開放し、換気を実施
  • 医師・看護師の常駐および救護室の設置

予断を許さない状況ですが、皆様のご来場をお待ちいたします。


ドロップキャップ

ドロップキャップとは段落先頭の文字を大きく組むことで、書籍の組版ではよく行われています。しかし、AH Formatter V6 にはドロップキャップの機能はありません。XSL-FOやCSSに勧告された仕様はありませんが、CSSにはドラフト仕様があります。

4. Initial Letters

そこには次のようなサンプルが最初に示されています。

sample-1
これをFOで強引に組むには、いろいろやり方がありますが、例えば次のようにしなければなりません。

<fo:block>
<fo:float axf:float-x="start" axf:float-wrap="wrap">
<fo:block-container height="5em" margin-top="-1.67em">
<fo:block font-size="5.53095em">É</fo:block>
</fo:block-container>
</fo:float>tudiant (au féminin étudiante) est un mot dérivé du latin ...

ここでは、font-size と margin-top などを手計算で設定して大きさと位置を合わせています。これらは、ドロップキャップが次のように配置されるように計算されています。cap-height や baseline の位置は、使用しているフォントによって決まります。

initial-letters-cap-height
AH Formatter でドロップキャップを自動組版するためには、これらの値を自動的に計算することが必要になります。そして、CSSのドラフトに合わせると次のように指定できればよいでしょう。

<fo:block axf:initial-letters="3">Étudiant (au féminin étudiante) est un mot dérivé du latin ...

これはもっとも単純な例で、実際のドロップキャップはこんな単純ではありません。<fo:float>を利用する実装では、本当の<fo:float>が絡んできたときの制御はとても複雑になります。CSSのドラフトは、行の高さが一定であるという暗黙の前提があります。行の高さが途中で変化するようなケースでは、結果を利用者が予測できず実装も極めて複雑になるでしょう。

ドロップキャップは、次期 AH Formatter で対応される予定です。


『Antenna House AHPDFXML 変換ライブラリ』のコマンドライン

『Antenna House AHPDFXML 変換ライブラリ』は、PDFファイルの内部データを、
XML(Extensible Markup Language:拡張可能なマークアップ言語)形式に変換するプログラムです。
このライブラリが出力するXML形式を「AHPDFXML形式」と呼びます。
PDF解析技術により文書構造を生成して、再利用に適したXMLデータを出力します。

『Antenna House AHPDFXML 変換ライブラリ』には、コマンドライン版アプリケーションが付属しています。
今回は”AHPDFXMLCmd.exe”について書いてみたいと思います。

標準の引数は次の通りです。

  • -i PDFファイル
    入力PDFファイルのパスを指定します。(必須)
  • -password パスワード
    入力PDFにパスワードが設定されている場合、この引数で指定します。
  • -o 出力先フォルダ
    AHPDFXML形式を出力するフォルダのパスを指定します。(必須)
    保存するしおり外部ファイルの形式を指定します。

      このフォルダには、カタログXML, ドキュメントXML, スタイルXML, アウトラインXML, 画像ファイルなどが出力されます。
  • -p 接頭子
    AHPDFXML形式ファイルの接頭子を指定します。(必須)
  • -start 開始ページ
    変換対象とする、開始ページを指定します。
    省略された場合や 0以下の場合は、先頭ページからとみなされます。
  • -end 終了ページ
    変換対象とする、終了ページを指定します。
    省略された場合や実際のページ数より大きい場合は最終ページまでとみなされます。

変換オプションの引数(一部)は次の通りです。

  • -piece
    文字情報(ahp:run)を、1文字単位で出力します。
    文字単位でレイアウト座標を得たい場合などで使用します。
  • -cid
    文字情報(ahp:run)の要素に、PDFのキャラクタIDを出力します。
  • -notable
    表の解析を行いません。表情報(ahp:table)も出力されません。
  • -emf
    線画をEMFに変換します。
    複数の線画をまとめられる場合は、まとめてPNGに変換します。
    PDFのページ中に表が存在する場合などは、まとめてPNGに変換することはしません。
    この条件が設定されていない場合は、線画はSVG形式に変換されます。

呼び出し例は次の通りです。

  • AHPDFXMLCmd.exe -i input.pdf -o output -p pdfxml -piece
    • -i input.pdf : input.pdf を読み込みます。
    • -o output : AHPDFXML形式を output フォルダ下へ書き出します。
    • -p hoge : 書き出されるファイルの接頭子です。
    • -piece : 文字情報を1文字単位で出力します。

AHPDFXML形式の利用例として『サンプルXSLTスタイルシート』をご用意しております。
XMLで表現することによって、データの扱いが容易になります。
XMLのメリットを最大限に活かしてPDFデータを活用できます。
弊社ウエブサイトより評価版の申し込みが可能です。是非ご評価ください。

製品に関するご質問は
sis@antenna.co.jp(SYSTEM担当)
または
oem@antenna.co.jp(OEM担当)
まで、お気軽にお問い合わせください。

評価版のお申込
評価版のお申込ページ

Webページ
http://www.antenna.co.jp/pdfxml/


『Antenna House AHPDFXML 変換ライブラリ』のご紹介

『Antenna House AHPDFXML 変換ライブラリ』は、PDFファイルの内部データを、
XML(Extensible Markup Language:拡張可能なマークアップ言語)形式に変換するプログラムです。
このライブラリが出力するXML形式を「AHPDFXML形式」と呼びます。
PDF解析技術により文書構造を生成して、再利用に適したXMLデータを出力します。

今回は”AHPDFXML形式”として出力される文書構造について書いてみたいと思います。

  • セクション要素
    セクション要素の属性は、矩形情報、段組み情報、縦書き/横書き情報です。
    セクション要素は、フレーム要素を含みます。
    段組み数は、テキストフレーム要素の配置から判断します。
  • フレーム要素
    フレーム要素の属性は、フレーム種別、矩形範囲、ファイルIDです。
    フレーム種別には、テキスト、表、画像、テキストボックスがあります。
    テキストフレームは段落要素を含みます。
    画像フレームには、カタログファイルに定義されたファイルのIDが指定されています。
  • 段落要素
    段落要素の属性は矩形範囲、段落スタイルIDです。
    段落スタイルには、先頭行インデント、左インデント、右インデントの情報があります。
    段落要素は、行要素を含みます。
    包含する行要素の開始位置、終了位置から、段落要素を生成しています。
  • 行要素
    行要素の属性は矩形範囲です。
    行要素はテキスト要素を含みます。
    包含するテキスト要素からベースラインを判断して、テキスト行を生成しています。
  • テキスト要素
    テキスト要素の属性は、矩形範囲と文字スタイルIDです。
    文字スタイルには、文字の大きさ、文字の色、文字のフォント、文字修飾(bold/italic、網かけ)の情報があります。
  • 表要素
    表要素の属性は、矩形情報です。
    表要素は、表の行要素を含みます。
  • 表の行要素
    表の行要素の属性は、矩形情報です。
    表の行要素は、セル要素を含みます。
  • セル要素
    セル要素の属性は、矩形情報とスタイルIDです。
    セル要素は、段落要素を含みます。
    PDF中の線画情報から、水平/垂直の線分を抜き出して、セルを生成しています。

AHPDFXML形式の利用例として『サンプルXSLTスタイルシート』をご用意しております。
XMLで表現することによって、データの扱いが容易になります。
XMLのメリットを最大限に活かしてPDFデータを活用できます。
弊社ウエブサイトより評価版の申し込みが可能です。是非ご評価ください。

製品に関するご質問は
sis@antenna.co.jp(SYSTEM担当)
または
oem@antenna.co.jp(OEM担当)
まで、お気軽にお問い合わせください。

評価版のお申込
評価版のお申込ページ

Webページ
http://www.antenna.co.jp/pdfxml/


第二回技術書同人誌博覧会に出店します。

毎日お疲れ様です。
本日は電子出版サービスグループが担当します。

アンテナハウスが「アンテナハウスCAS電子出版」でプリントオンデマンド出版している技術書は、10冊以上あります。製品マニュアルを含めると倍くらいでしょうか。

「技術書」に関する少部数(同人誌)即売会が定期的に開催されるようになって、はや数年。

かの「技術書典」が初めて開催されてから、もう7回目を迎え、開催するごとに規模を増しているのを見て、実は技術者開発者って、自分の知識や技術を外に出したい、新知識や新技術を取り込みたい、意見交換したいんだなと思いました。

わたしですか?
わたしはPCでテレビが見られてネットサーフィンできればオールオッケー!ストレスなく使えていればよい、根っからのコンシューマ(一般消費者)です。

それはさておき、技術書に絞った同人誌即売会に新しい会が生まれ、12月14日、第2回目が開催されることになりました。

第二回技術書同人誌博覧会

技術書典(抽選)とは違い、早い者勝ちなので、我がアンテナハウスは申し込み開始日に電光石火の勢いで応募しました!
今月の半ばから入場チケットの申し込みが出来るようになるそうなので、そろそろサイトページができるころかもしれません。

売り子の社長が面白いことを言っていました。

技術書典は最近、時間を区切り、概ね午前中(~13時まで)は有料チケット購入者だけが入れるようにし、午後の時間帯は無料開場するという方針を取っています。
(技術書同人誌博覧会も同じ様式ですが、無料チケットになります。)

さて、売り上げ結果はというと、チケットを購入した人が会場を回っている時間帯のほうが大きく、逆に午後の無料開放時間帯、来場者数は多いですが、驚くほど売り上げが少なかったということでした。
売り子から見る「客」の質は、チケットを購入した来場者のほうが圧倒的に高かったことがわかります。よく考えればわかることですが、面白いですよね。。

今回の会も、同じ現象が起きそうです。
第二回技術書同人誌博覧会、12月14日(土)、プラザマーム(アンテナハウスブース:3階-た04)で開催です。
お見逃しなく!そしてご来場・ご来店をお待ちしております!

技術書同人誌博覧会公式サイト:https://gishohaku.dev/
一般参加のご案内:https://blog.gishohaku.dev/entry/gishohaku2-attend
@技術書同人誌博覧会 運営事務局


oXygen 21.1 がリリースされています

oXygen のカレントバージョンは21.1です。古いバージョンをお使いの方はバージョンアップをご検討ください。

主な機能強化点は次のとおりです。

■ DITA 関連

  • 生成される WebHelp(日本語)の検索処理の改善
  • DITA マップやトピックから参照されるリソースの階層/依存関係の表示
  • 関連リンクとして追加できるトピックを素早く見つけられるように
  • 画像の挿入前にプレビュー確認

■ HTML 関連

  • 現在の編集場所で有効な要素、属性、および値の提案、多くの提案の注釈、およびHTML5仕様へのリンク

■ JSON 関連

  • JSON インスタンスを生成するためのさまざまなオプションを設定できるダイアログボックスを新設

その他多数の強化が行われています。詳しくは ここ をご参照ください。


「DITA Festa 2019 Tokyo」開催です

恒例の DITA Festa がやって来ます。
2019年11月27日(水)、28日(木)の二日間、場所は市ヶ谷駅のすぐ目の前です。

今回は、オムロン殿、日本電気殿、ローランド ディー.ジー.殿から DITA の導入事例発表があります。すでに受講受付が始まっていますので、興味のある方はお早めに。参加費は無料です。

詳しくは こちら をご参照ください。


海外出展情報 その2

10月14から17日にロンドンで開催された S1000D User Forum は、航空宇宙および防衛分野の技術文書を作成する多くのアンテナハウスのパートナーおよび顧客と会うことができました。アンテナハウスは卓上展示とベンダーとしてのプレゼンテーションを行いました。フォーラムには世界中から300人以上の航空宇宙および防衛分野の専門家が集まりましたが、その出席者の多くに弊社の Antenna House XSL Formatter を使用していただいています。また同じく弊社の製品である Regressions Testing System と、OSDC (Office Server Document Converter) の PDF を SVG に変換する機能に大きな関心が寄せられました。航空宇宙および防衛分野で使用される技術文書においては、依然としてページ出力が非常に重要とされていますが、現在の目標はその文書をタブレット上に表示することです。SVG になぜ関心があるのかというと、そのページを表示する速度にあります。

プレゼンテーションでは Antenna House XSL Formatter を使用してS1000D サンプル文書をフォーマットし、PDF と SVG 出力を作成しました。次に Regressions Testing System のデモンストレーションでは2つのディレクトリにある8つのペアになっている文書(合計で2,000ページ)の内容の比較を行いました。 デモンストレーションでは各ペアの文書の全ての相違点を2分以内に発見することができました。


Markdownセミナーを開催します

Markdownの活用例として「Markdown + CSS/TeXで冊子本を作ってみた ~仕組みと実践方法のレクチャー~」を開催します。

日 時: 2019年11月14日(木)
会 場: ITS健保センター大久保 1F A
住 所: 〒169-0073 東京都新宿区百人町2丁目27ー6
(関東ITソフトウェア健康保険組合)
イベント詳細: https://connpass.com/event/149490/
申込みページ: https://connpass.com/event/149490/

セミナーでご紹介する内容は、以下の予定です。

  • 第一部 書籍の原稿としてMarkdown を使う
    【LaTeXとPandoc による事例】
    LaTeX は、それ自身もドキュメントの構造化を支援する記法を備えていますが、最近ではより簡便な記法としてMarkdown を採用し、主にPDF 生成のためのエンジンとして使われることも増えています。本セミナーでは、そのような事例のひとつとして、LaTeX とPandoc を併用したMarkdown による書籍制作システムについて紹介します。
  • 第二部 簡単! Markdown+CSSによる冊子本作り―理論と実践
    【Markdownでどうやって原稿を書くか】
    Markdownで冊子本の原稿を書く方法を説明します。Markdown(CommonMarkを中心に)を使って原稿を書く方法と、冊子本を記述するのに必要な機能を検討します。Markdownでは不足する機能についてどのように対処するべきかを考えます。実際に冊子本の原稿を執筆した例を解説します。
    【Markdown原稿をPDFにするにはどうするか】
    マークダウンで作成した原稿から冊子本印刷用PDFを生成するまでの流れを解説します。コマンドラインでNode.js用のスクリプトを使用して原稿をHTMLに変換し、XSLTで目次と索引を自動生成したものをCSSでレイアウト指定してAHFormatterでPDFを出力する実践例の紹介となります。

また、「AH FormatterとCSSを使ったルーズリーフ出版」と AH Formatter に関する最新情報をお伝えします。

是非、ご参加ください。

〒103-0004
東京都中央区東日本橋2-1-6 東日本橋藤和ビル5F
アンテナハウス株式会社
◆ご購入に関するお問い合わせ(祝日を除く月~金曜日9:30~18:00)
TEL : 03-5829-9021
FAX : 03-5829-9023
E-mail: sis@antenna.co.jp
URL : https://www.antenna.co.jp/


Balisageで『Loose-leaf publishing using Antenna House and CSS』の発表 その3

Balisageで『Loose-leaf publishing using Antenna House and CSS』の発表 その2

この記事の続きです。
8月2日(金)米国Washington DCで開催された恒例Balisage会議にて米国の高名なコンサルタントであるEliot Kimber氏より「Loose-leaf publishing using Antenna House and CSS」と題した発表がありました。
原文はこちらにあります:

Loose-leaf publishing using Antenna House and CSS(Balisage: The Markup Conference 2019 July 30 – August 2, 2019)

発表資料ではこれらの課題をどのように解決したかを具体的なサンプルコードを示し説明を行っています。原文の他に、日本語翻訳版もWeb上にご用意いたしました。ぜひご参照いただき、より理解を深めていただければ幸いです。

https://www.antenna.co.jp/AHF/ahf_jirei/pdf/201909/Loose-leafPublishingUsingAntennaHouseAndCSS-J.pdf


Pages: 1 2 3 4 5 6 7 8 9 10 ... 14 15 16 Next