カテゴリー別アーカイブ: 構造化文書

PDFのレイヤー

PDFには、レイヤーという便利な機能があります。
レイヤーは、PDFの内容をまとめて、表示を切り替えたり印刷を切り替えたりします。 Acrobatでは次のようなダイアログでコントロールします。

layer-dialog

AH Formatter には、このレイヤーを出力する機能があります。
今回は、PDFのレイヤーでの言語指定について取り上げます。

レイヤーで指定した言語は、どのように振る舞うのでしょうか。
仕様では次のように書かれています(PDF 32000-1:2008)。

Language dictionary (Optional) A dictionary specifying the language of the content controlled by this optional content group. It may contain the following two entries:

Lang (required) A text string that specifies a language and possibly a locale (see 14.9.2, “Natural Language Specification”). For example, es-MX represents Mexican Spanish.
Preferred (optional) A name whose values shall be either ON or OFF. Default value: OFF. it shall be used by conforming readers when there is a partial match but no exact match between the system language and the language strings in all usage dictionaries. See 8.11.4.4, “Usage and Usage Application Dictionaries” for more information.

Language については、次のようにも書かれています。

Language: This category shall allow the selection of content based on the language and locale of the application. If an exact match to the language and locale is found among the Lang entries of the optional content groups in the usage application dictionary’s OCGs list, all groups that have exact matches shall receive an ON recommendation. If no exact match is found, but a partial match is found (that is, the language matches but not the locale), all partially matching groups that have Preferred entries with a value of ON shall receive an ON recommendation. All other groups shall receive an OFF recommendation.

PDFに指定されたLanguageは、アプリケーションの言語と地域に基づくと書かれています。アプリケーションとは、PDFのビューア、例えばAcrobatのことです。アプリケーションがレイヤーをサポートしていなければ、もちろん何も起こりません。Acrobatはサポートしています。

PDFに、日本語用のレイヤーと英語用のレイヤーを用意しておけば、アプリケーションの言語によって自動的に一方が表示され、他方が表示されないということができます。では、アプリケーションの言語とは何でしょう。仕様書中でそのことについて書かれている部分はありません。
そこで、どうすれば言語によるコントロールが意図どおりにできるのかを、Acrobatを用いて、試行錯誤を交えながらいろいろ探ってみました。

PDFには、Catalog辞書に言語を明示することができます。これは、文書のプロパティで確認することができます。AH Formatter では、<fo:root> に記述した言語がそこに反映されます。

<fo:root ... xml:lang="ja" ...>

property-dialog

アプリケーションの言語とは、これのことでしょうか。
いいえ、この言語はレイヤーの言語とは関係ありません。
これは、PDFの言語であってアプリケーションの言語ではありません。
アプリケーションの言語とは、Acrobatでは環境設定の言語環境にあるアプリケーションを表示する言語に対応することがわかりました。

lang-env

では、アプリケーションの言語は、具体的にはどう表記されているのでしょうか。14.9.2.2 Language Identifiers には次のような記述があります。

A language identifier shall either be the empty text string, to indicate that the language is unknown, or a Language-Tag as defined in RFC 3066, Tags for the Identification of Languages.

Although language codes are commonly represented using lowercase letters and country codes are commonly represented using uppercase letters, all tags shall be treated as case insensitive.

ざっくり言えば、PDFに書かれるLangの値は、RFC 3066 に従っていて大文字小文字は区別しない、ということです。RFC 3066 の言語コードは ISO 639、国コードは ISO 3166 によります。アプリケーションの言語も、ISO 639 と ISO 3166 で表現されているはずです。
実際にAcrobatでアプリケーションを表示する言語を変更すると、どこにどういう情報が書かれるのかはわかりませんでした。しかし、日本語なら ja とか ja-JP などが設定されると、常識的には予想するでしょう。

Preferredを指定していないと、Langに指定したものとアプリケーションの言語の間では完全一致性が判断されることになっています。そこで、日本語環境のとき、どういう指定をしたら完全一致するのかを調べました。

  • ja ⇒ NG
  • jpn ⇒ NG
  • ja-JP ⇒ NG
  • jpn-JP ⇒ NG
  • jpn-JPN ⇒ NG
  • ja_JP ⇒ NG
  • jpn_JP ⇒ NG
  • jpn_JPN ⇒ NG
  • ja-jp ⇒ OK

結果は、まったく想定外でした。仕様には大文字小文字区別しないと明記してあるし、国コードは大文字で表記するのが普通とも明記されています。これはどういうことでしょうか。Acrobatは仕様どおりに動作しているようには見えません。Acrobatの不具合なんでしょうか。仕様の見落としがあるのでしょうか。

完全一致させるのにこんな試行錯誤した上、それが正しいのかどうか裏づけも取れないのでは、完全一致を使うのは現実的ではない気がします。Preferredを指定すると、かなりあいまいな指定でもマッチします。
日本語は、それを話す国は日本しかないですが、英語やポルトガル語スペイン語などはそんなことはありません。例えば、en-US(米国英語)と en-GB(英国英語)を区別したいこともあるはずです。Preferredでは、それらを区別させることはできませんでした。どちらもすべての en にマッチしてしまうようです。つまり、国コードを明示したいなら、Preferredを指定できないということになります。

次に Preferred な ja と、そうでない ja-jp の指定を混在させたらどうなるか見てみます。
日本語環境ではどちらも表示されそうなものですが、ja-jp の方だけ表示されて、ja は表示されません。完全一致するものが見つかったらそれしか表示されない、ということになっているからのようです。このことは、en-US と en-GB を用意し、両者の共通部分を en として表現したくても、できないということを意味します。

AH Formatter V6.4 では、次のようにレイヤーへの言語指定を行ないます。
実際には重なり合った領域に内容を配置するでしょうから、<fo:block-container> などを利用することになります。

<?xml version="1.0"?>
<fo:root xmlns:fo="http://www.w3.org/1999/XSL/Format"
         xmlns:axf="http://www.antennahouse.com/names/XSL/Extensions"
         axf:layer-settings="'Japanese layer' lang 'ja' preferred,
                             'English layer' lang 'en' preferred">
...
<fo:block axf:layer="'Japanese layer'">
こんにちは
</fo:block>
...
<fo:block axf:layer="'English layer'">
Hello
</fo:block>
...

AH Formatter V6.4 MR3 以降を利用してください。

 




瞬簡PDF 変換 2024
PDFをOffice文書へ高精度変換


瞬簡PDF 編集 2024
かんたん操作でPDFを自由自在に編集

本はWeb化するか? PDFとブック型WebページとEPUBを考える

4月25日よりCAS-UBのバナーを次のように変更しました。この背景には、最近、本(PDF)、ブック型Webページ[1]、EPUBの関係について考えたことがあります。

CAS電子出版では『XSL-FOの基礎 第二版』を2017年3月に発売しました。詳しくはこちらをご覧ください:『XSL-FO の基礎 第2版 – XML を組版するためのレイアウト仕様』

本書は、現在、アマゾンなどのプリントオンデマンドによって紙の本として販売しています。一方で、4月から全文をWebページ版として公開しています。

もともと本書の出版は、本の販売収益よりもむしろ、XSL-FOという技術を普及促進し、ひいては弊社のAH Formatterの販売に繫げようということを意図しています。初版はKindle版などを販売しましたが、第二版からKindle版を見合わせて、Webページ版として公開することにしました。

これは、CAS-UB V4のユーザーガイドの体験に基づきます。CAS-UBは、V4からユーザーガイドなどのドキュメントをPDF版とWebページ版を作って両方ともWebで公開しています:CAS-UBサポート&ガイド一覧(V4よりも前はPDF版とEPUB版を公開していましたが、EPUB版はあまり利用されないようなので廃止しました)。

こうしてPDF版とWebページ版を並べておきますと、自分ではPDF版を参照することがなくなり、Webページ版を参照するようになってしまいました。主に、CAS記法の説明ページやPDF出力のガイドを参照するのですが、情報を参照する際の利便性という点ではPDFよりもWebページが圧倒的に便利です。(今頃になって! という感もありますが、情報参照のための利用という点では、PDFはWebページに決して勝てないと思います!)

利便性では:Webページ版≫PDF版>EPUB版 という状態です。

4月にMicrosoft Windows 10の大型アップデートがあり、新しいEdgeでEPUB3を表示できるようになりました。これを体験していただく参考として、Webページ版に加えて、4月21日からEPUB3の公開も始めました(EPUB復活?)。

(EPUBは、こちらからダウンロードできます:CAS電子出版出版物一覧のページ

Edgeの紹介ブログはこちら:Microsoft EdgeのEPUB表示機能はなかなか良い。これからはEdgeだと言いたいところですが、しかし、残念な点もあります。 EdgeでEPUBが復活として、ブック型情報をPDFとWebページ版とEPUB版の3つのかたちで提供できるようになりました。それが今後どうなるかです。

CAS-UBの場合は、ブック型Webページの作り方をさらに改善する必要があると考えています。CAS-UB V4のWebページ版は、短期間で作ったもので完成形とは言えない面があります。またPC版とモバイル版のWebページを統合できていないのも問題です。ということで、CAS-UBの次の課題は、Webページ版のテーマ化、レスポンシブWebページ版の選択を追加することです。

[1] 本やマニュアルのような冊子として提供されるものをWebページにしたものをブック型Webページと(勝手に)呼びます。ブック型Webページは、限定された読者を対象にします。大勢にPRすることを主目的にしませんので、横串検索あるいはSEOの観点よりも、ドリルダウンで情報を探す内部検索や、主にコンテンツ内部をナビゲーションしていく仕組みが重要と考えます。マニュアルの世界ではWebHelpと呼ぶことがあります。oXygenとか、RoboHelpなどの製品にはWebHelpという言葉が使われています。但し、WebHelpという言葉自体には厳密な定義はないようです。
[2] AH Formatter
[3] 補足ですが、今日は、ブック型Webページのデザインの考え方について書かれた本を探して、神田の三省堂本店に並んでいるWebデザインの本を端から見てみました。Webページのデザインについての解説書はたくさんありますが、大抵の解説書は魅せるデザインをどう作るかというテーマを中心に取リ上げているようです。しかも、トップページのレイアウトパターンと、1つのHTMLファイルの作り方の解説が主体です。ひと塊りのWebページをどのように構成するかという良い解説は見つかりません。テクニカルドキュメンテーションの業界ではどうなんでしょう?

続きを書きました本はWeb化するか? (続き)Webアプリケーション化したオンライン版の本 vs シンプルなHTML+CSSの本

■関連記事
「ワンソースマルチユースで拓く、ブック型Webページの未来」(本ブログと続きの2回分をまとめて整理し直しました)




瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品!


瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識

oXygen 19.0がリリースされました

oXygen 19.0 がリリースされました。

待望のメジャーバージョンアップです。
新機能ですが、DITA 関連については以下のようなものがあります。

その他にもいろいろあるようなので、ご興味のある方は oXygen の WEB ページでチェックしてみてください。
https://www.oxygenxml.com/xml_editor/whats_new.html




瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品!


瞬簡PDF 変換 2024
PDFをOffice文書へ高精度変換

XMetaL12.0(英語版)がリリースされました

XMetaL12.0(英語版)がリリースされました。

待望のメジャーバージョンアップです。
新機能ですが、以下のようなものがあります。

  • DITA Subject scheme の適用
    DITA map で参照している Scheme map を自動的に認識します。
  • カスタムテーブルモデルのテーブル編集機能の強化
    組み込みソートと塗りつぶし操作
    セル操作の分割とマージ
    マルチセル選択
  • DITA-OpenToolkit 2.4.3 搭載
    最新の DITA パブリッシングツール 2.4.3(XMetaL12.0リリーズ時点)がご利用いただけます。必要に応じて、2.2.4 および 2.0 もご利用いただけます。

その他の機能については下記をご参照ください。
https://www.antenna.co.jp/xmetal/#xmetal_12e

それからこれは非公式情報なのですが、10月くらいに日本語版のリリースを計画しているみたいです。乞うご期待を。




瞬簡PDF 変換 2024
PDFをOffice文書へ高精度変換


アウトライナー
PDFを解析して しおり・目次を自動生成

Formatter Club 再び!

ご無沙汰をしております。Formatter Clubです。

とご挨拶をする程度に、「Formatter Club」名義での投稿はしばらく途絶えていたような気がします。

活動の一環として、AH Formatterの導入事例 を紹介してまいりましたが、更新も追加も長らく手付かずの開店休業状態で、AH Formatter をご利用いただいている「XML 組版推し」の皆さんに大変申し訳が無いところです。

と、下を向いてばかりいてもらちがあきません。

Formatter Club は、再始動へ向けて、新たに会員の募集と共に、AH Formatter の導入事例を募集いたします。

導入事例については、既に何社かにお声を掛けさせていただいてますが、大人の事情もありまして、なかなか色好いご回答をいただけてはおりません。

そこで、是非とも我が社の事例を公開したい、人知れず進めていたプロジェクトを今こそ明らかにする時が来た!という方がいらっしゃれば、ご連絡いただけますでしょうか。
組版結果の美しさだけではなく、如何に困難を克服したかなどのトピックがあれば、同様の課題を抱えている方の参考になると考えています。

また、実運用している事例だけではなく、導入提案を前提として製作した AHFormatter を組み込んだオリジナルアプリの紹介も考えています。
実際の利用環境や目的に合わせて、いろいろと知恵を絞られているのではないかと思います。
実際に使う側の立場から必要と考えた機能を実装した、そんな事例を求めています。

AH Formatter は組版エンジンです。エンジンにまたがっただけでは、走りもしなければ飛ぶこともできません。

    • AH Formatter を利用する際に、まず考えることは、
    • XML(XSL-FO) はどう作る?
    • レイアウトはどう調整する?
    • データの管理はどうする?

これらをクリアした先に、やっと導入へ向けての具体的な道筋が見えてきます。

でも、難しく考えることはありません。
シャーシに乗せて車輪を付けて、ステアリングがあれば何とかなります。シートや屋根は好みに応じて後から何とかすればよい。そんなシンプルでコンパクトにパッケージ化されたアプリがあれば、誰もが「見たい」「買いたい」「使いたい」と思うに違いありません。

これまで、Formatter Club は XSL-FO の仕様を追求し、それを AH Formatter で具体化することを中心に活動をしてきました。ある意味高度な技術情報の交換の場だったとも言えます。
これからは、AH Formatter という製品をどうやって編集・制作の現場で運用を開始できるか、以下に課題を解決して軟着陸させられるかを含めた、運用の情報交換の場とさせていただければと思います。
会員や技術パートナーの皆様のお力を借りて。

「Formatter Club は、アンテナハウスの XML 自動組版ソフト『AH Formatter』を導入されているユーザーや関心を持っていただいている皆様と開発者とを繋ぎ、会員同士の交流、情報交換により『AH Formatter』の利用技術を向上させ、より皆様のお役に立てる製品としていくために役立てることを目的として発足いたしました。(略)」
(Formatter Club 紹介サイト より)

「看板」を泣かせないためにも・・・・

Formatter Club へ参加ご希望の方は、紹介サイト より、参加申込書用 PDF をダウンロードしていただき、ご記入の上メールもしくは FAX でお申し込みください。
メールアドレス:naganawa@antenna.co.jp または nukaga@antenna.co.jp(Fomatter Club 担当)
FAX 番号:03-5829-9024
また、Formatter Club へご要望も、同様の連絡先宛にお願い致します。




HTML on Word
WebページをWordで作る!


アウトライナー
PDFを解析して しおり・目次を自動生成

ソフトウェア&アプリ開発展(SODEC)に出展

~ソリューション・システムコンポーネント製品に愛をこめて~

5月10日より開催される「第26回ソフトウェア&アプリ開発展」に、アンテナハウスはシステムコンポーネント製品、ソリューション製品を出展します。
ご来場される際には、是非とも弊社ブースへお立ち寄りください。


【開催概要】
開催日程:2017年5月10日(水)~5月12日(金)
開催時間:10:00~18:00(最終日のみ17:00終了)
開催場所:東京ビッグサイト
ブース№:東11-31
http://www.sodec.jp/


今年の私たちは、去年とはちょっと違います。
去年よりひとつ年老いた(いぃえ)ひとつ年輪を重ね、そして気が付きました。

自分たちのできること、製品の機能を全面に押し出すばかりではなく、潜在顧客の声なき声に耳を傾けること。課題解決こそがモノづくりの原点だったのでは、と。

ということで、今回も出展のテーマを勝手に作らせていただきました。

「皆さんがやりたいことの課題解決にご協力します!」

とはいえ、私たちのできることは限られています。
突然、AI に囲碁を指させたり、月面探査機を飛ばしたりはできません。

私たちの得意技(ソリューション・システムコンポーネント製品)は、

  • 文書レンダリング技術
    ワープロ、表計算、図形、Web ファイル形式等のあらゆるデータを、高精度で相互変換する技術の開発と商品化をします。
  • PDF 技術
    PDF を電子配信の時代の紙に相当する基盤技術と考え、PDF の表示、生成、編集、変換・再利用など PDF 技術の開発と製品化を推進します
  • XML 文書を利用した組版技術
    W3C の XSL-FO 仕様に準拠し、世界中のお客様にご利用いただける大容量・多言語データに最適な自動組版技術と、独自開発した PDF 出力エンジンで、アクセシブルなタグ付き PDF や印刷用の PDF/X、長期保存 PDF/A などさまざまな PDF 形式で出力ができます。

これらの分野で課題を抱えている方、解決策も模索している方は、お気軽に足をお運び下さい。
解決できるまで、とことん、お付き合いをさせていただきます。
万が一何の解決にならなかったとしても、気晴らしの話し相手くらいにはなれます・・・。

それまで待てない、今すぐ何とかしたいという方は、下記お問い合せ先へご連絡下さい。
どこへでも駆け付けます !

お問い合せ先
アンテナハウス株式会社 S1営業グループ
sis@antenna.co.jp
https://www.antenna.co.jp/system/

今年のアンテナハウスは、ちょっと違うかも・・・。




瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品!


HTML on Word
WebページをWordで作る!

『XSL-FOの基礎 第2版』プリントオンデマンド版アマゾンより発売になりました。

昨年5月に発売しました『XSL-FOの基礎』初版を大幅に改訂して、『XSL-FOの基礎 第2版』としました。

この経緯につきましては、CAS-SUPPORTのブログに紹介しています。

(1) 『XSL-FOの基礎』画像制作のこと。Word経由でインポートした画像は印刷品質の劣化が激しいため、第2版ではできるだけSVG形式に変更した件。
(2) 『XSL-FOの基礎 第2版』は全文をWebでも公開。CAS-UBでプリントオンデマンド用PDFを作り、Web生成機能でWebページもワンタッチで完成。

本日(3月29日)よりアマゾンのプリントオンデマンドにて本書発売となりました。

【第2版書誌情報】
出版社: アンテナハウスCAS電子出版
発売日:2017年3月
著者:アンテナハウス株式会社
発行形式:プリントオンデマンド版
サイズ:B5判 横組み
ページ数:228ページ
価格(税込):2,700円
ISBN:978-4-900552-48-7
販売店:アマゾン(amazon.co.jp)(3月29日発売)

なお、本書は来月4月9日に開催される「技術書典2」に出品して販売致します。アマゾンよりも大幅に安く販売する予定ですので、技術書典2に来場可能な方はそちらでお求めいただくことをお勧めします。

また、CAS-SUPPORTブログでも紹介しました通り、全文をWebでも公開しております。

『XSL-FOの基礎 第2版』全文Web

「技術書典2」のご案内




瞬簡PDF 変換 2024
PDFをOffice文書へ高精度変換


瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識

AH Formatter 有償技術サポートのご案内

こんにちは。
AH Formatter』のサポート担当です。

『AH Formatter』は販売開始から 17年を迎えました。
現在サポートを担当しておりますわたくしは一番最初の 『XSL Formatter V1』から
この製品に関わってまいりました。
早いもので 17年、国内国外問わず世界中の多くのお客様にご利用いただいております。
最近は DITA を導入したマニュアルの多言語対応として『AH Formatter』を使われるお客様も増えてまいりました。
xx年前、弊社社長から “DITA を勉強してセミナーを開きなさい” と言われたとき、
DITA ってなんぞや?から始まり、DITA ってなんて読むんだろと検索してみても
当初はお酒の情報しか出てこなかったことを思い出します(笑)

弊社サポートでは、通常の保守サポートに加え、
有償技術サポート」がございます。
XSL-FO の仕様解説や、XSLTスタイルシートの “こうしたいけどよくわからない” といった問題に
具体的なアドバイスを行っております。
わたくしの 17年のスキルが皆様のお役に立てますよう努力いたしますので
ご検討いただけますと幸いです。

AH Formatter ロゴ

 




瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品!


HTML on Word
WebページをWordで作る!

AH Formatter 機能のご紹介:CGM の描画(ISO/IEC 8632、WebCGM 2.1)

CGM(Computer Graphics Metafile)[1]は、ベクトルグラフィックスを表現する標準ファイル形式です。ISO/IEC 8632 の CGM[2] 及び W3C のWebCGM[3]で規定されています。自動車製造・航空機製造・機械などの製造業で良く使われています[4]

AH Formatter』はCGMとWebCGMを独自開発したエンジンにより描画し、描画した結果を画面に表示したり、印刷したり、PDFの中に線画(ベクタ画像)として作成できます。

CGM はベクタ画像として出力されるため画質は劣化せず高い解像度で描画することが可能です。また、『AH Formatter V6.4』において描画エンジンを完全に書き替え、これまで以上に多くの要素へ対応いたしました。
CGM仕様の実装状況(オンラインマニュアル)

一部ですが、V6.4 において新たに対応した描画を V6.3 と比較した結果を紹介します。
AH Formatter の CGM 描画

CGM 画像は W3C の Test Suite より引用しております。
引用元:WebCGM 2.1 Test Suite. “Copyright © 2002-2006, Lofton Henderson. All Rights Reserved.”

『AH Formatter』のサンプルFO集には、本機能の動作が確認できるサンプル「グラフィクス CGM の表示 (<fo:external-graphic>)」を掲載しております。

なお、CGM を描画するには、『AH Formatter CGM オプション』をご購入していただく必要があります。

『AH Formatter』は主にバージョンアップのたびに機能強化や新機能の追加を行っています。
“あったら便利な機能” も既に追加されていることがございますので、どうぞお気軽にサポートにお問い合わせください。
未実装の機能であれば、ご要望として承り、今後の開発の参考にさせていただきます。

『AH Formatter』の評価版にて CGM の描画をお試しいただけます。
評価版は次のページよりお申し込みいただけます。ご興味のある方は是非お試しください。
AH Formatter 評価版のお申し込み

[1] Computer Graphics Metafile
[2] ISO/IEC 8632-1:1999
[3] WebCGM 2.1
[4]HP Designjet Printers – Usage of the Computer Graphics Metafile (CGM)-Who uses CGM?

※3月26日冒頭部分を更新




瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識


瞬簡PDF 作成 2024
ドラッグ&ドロップでPDF作成

Antenna House Formatter V6.4 のご紹介

昨年 12月に XML/HTML 自動組版ソフトのベストセラー『AH Formatter』をバージョンアップした『AH Formatter V6.4』を公開しました。早いもので現在、改訂2版の準備中です。

AH Formatter ロゴ

『AH Formatter』は XML で記述されたマニュアル、契約書、報告書・書籍などを XSL-FO または CSS を使ってレイアウト指定して、PDF に出力したり印刷するソフトウェアです。

XSL-FO は W3C が XML に対するレイアウト指定の標準として勧告している世界標準です。国内外で『AH Formatter』は最も優れた XSL-FO 準拠製品との評価を確立しており、現在、自動車、携帯電話、航空機、OA 機器のメーカ等のマニュアル制作システムなど数千社のお客様にお使いいただいています。

詳しくは製品ページをご覧ください。

AH Formatter フロー

 
続きを読む




瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識


瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品!
Pages: Prev 1 2 3 ... 16 17 18 19 20 21 22 ... 49 50 51 Next