カテゴリー別アーカイブ: 構造化文書

あらゆる文書には構造がある?

原稿に見出しをつけると、階層構造が分かりやすくなって読み易くなります。というようなことを前回書きました。⇒構造化文書とは何か?

構造化文書をつくるときは、あらかじめ構造を規定し、その構造に従って文書を編集します。では、逆に普通に書かれた任意の文書を構造化できるでしょうか?

編集者の仕事についての本を読みますと、原稿には、内容順序(前付・本文・後付など)があり、また、一般の著作物では、章・節・項というような構成があり、大見出し・中見出し・小見出しをつけて整理するとあります。(『原稿編集ルールブック』日本エディタースクール、2005年3月11日、p.8 C項による)。

そうしますと、著作物の多くは、内容順序や階層の構成をもたせることができるはずです。こうして整理された原稿には整理したような構造があるといえます。

著者から提出された原稿をもとに、内容順序や階層化した見出しを付けるのは編集者の仕事のひとつでしょう。出版に値する原稿の多くは、こうした整理ができるでしょうから、あらゆる文書には構造がある、とはいえないにしても、出版された文書にはそれなりの構造がある、といえるでしょう。

さて、文書に、こうした構造を付与したのが原始的なマークアップです。⇒マークアップとは

しかし、このような原始的なマークアップでは、原稿=文書毎にばらばらに、アドホックになってしまいます。1冊ずつ本を作るにはこれでもいいでしょうが、工学的に扱うには不十分または不経済です。

これを科学的=工学的に行うことを考えるのが、構造化文書の技術です。そのためには、マークアップ方法のルール化、次に標準化が必要でしょう。




アウトライナー
PDFを解析して しおり・目次を自動生成


瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識

DITA-OT プラグイン “PDF5-ML” 解説セミナー

本セミナーで発表したプレゼンテーション資料を公開しました。(2016年1月5日)
実践!PDF5-ML プラグイン(PDF)


DITA インスタンスを PDF 化するためのベースとなるプラグイン “PDF5-ML” の解説を開発者自身が行うセミナーを開催します。


日時:2015/12/22(火) 14:30-16:30
会場:中央区立産業会館 第3集会室 http://www.chuo-sangyo.jp/access/access.html
参加費:無料
募集人員:18名


PDF5-ML” は DITA インスタンスを PDF 化するためのベースとなるプラグインです。今年の8月にGitHub 上でオープンソースとしてリリース(https://github.com/AntennaHouse/pdf5-ml)されました。
プラグイン開発者はこれを使うことで効率的に開発ができ、エンドユーザは開発コストを低減させることができます。

特徴のひとつに徹底した多言語対応があります。
ひとつのトピックファイルに多言語を混在させることができ、各言語毎に適切なフォントを割り当てることができます。 また、表紙を自由にレイアウトする仕組みを持っています。 これらの機能は従来のプラグイン(PDF2)は持っていません。

“PDF5-ML” は本当に使えるのか?と問われれば、答えは “Yes!” です。
今までの豊富な開発実績から得た経験を基に “PDF5-ML” は開発されました。もはや Yahoo! の dita-users group に「プラグイン開発で困っているんだけど」などと質問を投げかける必要はありません。

本セミナーでは開発者自身が PDF5-ML について解説を行い、ご質問にお答えいたします。

申し込みはこちらからお願いします。
http://www.kokuchpro.com/event/6032ae2239b9c5925d2502aca8c69db6/
 
 




瞬簡PDF 変換 2024
PDFをOffice文書へ高精度変換


瞬簡PDF 編集 2024
かんたん操作でPDFを自由自在に編集

構造化文書とは何か?

新年、明けましておめでとうございます。

弊社では、2016年の課題のひとつとして、構造化文書の普及促進に重点的に取り組む予定です。構造化文書とは、文書の構造をマークアップした文書のことです。

では、文書の構造とはなんでしょうか? どんな意義があるのでしょうか?

文書構造の一つに、階層構造があります。2015年の暮れにJEPAのebookpediaで「階層構造とは」という用語解説が発表されました。この用語解説は人気抜群なのだそうです。

ebookpedia「階層構造とは」

主に電子書籍の階層構造について説明したものですが、簡単に整理すると次のようになるでしょう。

1.階層構造とは、章・節・項のような、つまり、大見出し、中見出し、小見出しのような見出しをつけること

2.階層構造は、XHTMLの<section>, <h1>~<h6>のようなタグで付ける。

3.階層構造の見出しによって、文章の持つ意味や重要度を差別化でき、読み手に意味の重要度が伝わる。また、目次を作ることができる。

4.タグに対して、スタイルシート(CSS)で重み付けと視覚的表現を紐づける。CSSを書き換えることで、見出しの色やフォントを切り替えられる。

この用語説明で、階層構造とはなにか? どんな意義があるかが大雑把に分かります。電子書籍のような簡単な出版物では、この程度の理解で十分かもしれません。しかし、電子書籍についていえば、eboookpediaでも少し触れられていますが、階層構造のような簡単な概念さえ、様々な見解があって必ずしも完全に合意されているわけではないようです。

文書の著者・編集者・制作者は、何らかの構造を念頭に置いているでしょう。これを暗黙ではなくて、明示的なルールでマークアップしたときに、構造化文書となります。タグはマークアップ手段のひとつです。

ところで、階層化以外の構造もあります。例えば、DITA(Darwin Information Architecture)では、技術文書を対象にして、構造についてもっと高度に定義しています。高度な構造は作成に手間がかかりますが、それなりの効果もあります。DITAにおける構造については、後日別途検討する予定です。

続きは:
1. あらゆる文書には構造がある?
2. 多くの文書は目的に応じた構造を持つ。その構造を明示化したのが構造化文書

関連ブログ(CASブログ)
CAS記法のマークアップがなぜ必要なのかー図版とキャプションの例
コンテンツの構造化とは何か? 構造化の目的、手段は? Word文書のスタイル付けとマークアップの関係

[参考資料](用語解説)
1.マークアップとは
2.DITA




瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品!


瞬簡PDF 作成 2024
ドラッグ&ドロップでPDF作成

組版した結果の文字位置が思い通りにならない―思いもよらない盲点

こんにちは。
AH Formatter』のサポート担当です。

お客様からのお問い合わせで、時々、
「組版した結果の文字位置が思い通りにならない」というのがあります。
詳しい状況をお聞きすると、FO は次のようになっていました。

<fo:block> AH Formatter について </fo:block>
<fo:block> AH Formatter V6.2 は、XSL-FOを使った組版や
CSSを使ったXML/HTMLが使える、組版・印刷ソフトウェアです。 </fo:block>

元々のデータでタイトルや段落中に空白や改行を使って位置を調整していたのでしょうね。
(XSLTスタイルシートでも空白の扱いは難しいですがここでは置いときます)

これをいざ組版してみたらどうなるでしょう。

組版結果

元々あった空白や改行は???

XSL-FO では次のような仕様があるのです。

7.16.7 “linefeed-treatment”
http://www.w3.org/TR/xsl11/#linefeed-treatment
Value: ignore | preserve | treat-as-space | treat-as-zero-width-space | inherit
Initial: treat-as-space
改行コード(U+000A)をどのように扱うかが定義されています。
初期値は “treat-as-space” ですので空白文字として扱われます。

7.16.8 “white-space-treatment”
http://www.w3.org/TR/xsl11/#white-space-treatment
Value: ignore | preserve | ignore-if-before-linefeed | ignore-if-after-linefeed | ignore-if-surrounding-linefeed | inherit
Initial: ignore-if-surrounding-linefeed
これは空白文字(U+0020)の扱いについてです。
初期値は “ignore-if-surrounding-linefeed” です。改行の前後の空白は無視されます。
行の最初と最後の空白は削除されたようになります。

7.16.12 “white-space-collapse”
http://www.w3.org/TR/xsl11/#white-space-collapse
Value: false | true | inherit
Initial: true
これは連続した空白の処理です。
初期値の “true” では、連続した複数の空白文字(U+0020)は一つの空白として扱われます。

まずは、このブロックから見ていきましょう。
<fo:block> AH Formatter について </fo:block>

white-space-collapse=”true” によって「AH Formatter について」の前後にある空白は1つにまとめられます。
次に、white-space-treatment=”ignore-if-surrounding-linefeed” によってその空白も削除されてしまいます。
white-space-collapse=”false” white-space-treatment=”preserve” を指定することで元々あった空白は残ります。

こちらのブロックは改行コードと空白が使われています。
<fo:block> AH Formatter V6.2 は、XSL-FOを使った組版や
CSSを使ったXML/HTMLが使える、組版・印刷ソフトウェアです。 </fo:block>

改行コードを有効にするためには、linefeed-treatment=”preserve” を指定します。

しかしながら、スタイルシートを使った組版はそもそも「コンテンツとレイアウトの分離」というのを
前提に考えることが重要ではないかと思います。
なので、空白文字を使った位置合わせ、というのはあまり望ましくないと感じています。

こうしたお問い合わせは意外と少なくありません。
本日のブログのタイトルは、長年サポートをやっておりますと、
こんな話は基本的なことだろうと思っていたのですが
思い込みは良くないというわたくしへの戒めでございます。

 




瞬簡PDF 編集 2024
かんたん操作でPDFを自由自在に編集


瞬簡PDF 変換 2024
PDFをOffice文書へ高精度変換

『AH Formatter』導入事例、ご意見をお聞かせください。

発売から16年目を迎えました『AH XSL Formatter』では、
これまでにご利用者様の導入事例を紹介する
事例紹介セミナーを開催しています。

今年は 10月15日に開催され、多くの方にご参加いただきました。
過去に開催されたセミナーの資料は、
AH Formatter 導入事例紹介セミナー資料」よりご覧いただけます。

また、ブログでも開催時の様子を紹介した記事がございます。
「AH Formatter 事例紹介セミナー」開催しました。(2014年7月9日の記事)
事例紹介セミナーの検索結果

事例紹介セミナーは今後も随時開催してまいります。
『AH Formatter』の導入事例は常に募集しております。
ご利用者様の声は弊社製品のみならず、業界を盛り上げていきます。
是非ともご紹介、ご協力をいただければ幸いです。

詳細・応募につきましては弊社システム営業グループ(sis@antenna.co.jp)までご連絡ください。

また、導入事例だけでなくご利用者様からの
“これがあれば”、”こんなことができるのか?”など
ご要望、お悩みの点は是非お聞かせください。

私たちも新機能、追加など日々検討していますが、皆様からのご意見が励みになります!
評価版のご利用者からのご意見もお待ちしております。
よろしくお願いいたします。

『AH Formatter』の評価版は以下のページよりお申し込みいただけます。
AH Formatter V6 評価版のお申し込み

 




瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品!


瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識

AH XSL Formatter が ComponentSource の Top 100 Product Award を受賞しました。

このたび、弊社の『AH XSL Formatter』は、「ComponentSource」が扱う 30,000以上の製品の中からベストセラー商品に贈られる「Bestselling Product Awards for 2014-2015」を受賞しました!

AH XSL Formatter Standard - Top 100 Product Award
Product Awards
AH XSL Formatter Standard – Top 100 Product Award

また、開発元に贈られる「Bestselling Publisher Awards for 2014-2015」も受賞しました。

Antenna House - Top 50 Publisher Award
Publisher Award
Antenna House – Top 50 Publisher Award

今回受賞した『AH XSL Formatter』は、XML 文書を組版するための仕様として W3C で勧告された、「Extensible Stylesheet Language (XSL) Version 1.1」によるレイアウト指定をサポートした自動組版・印刷ソフトウェアです。本製品を使うことで、大量の XML 資産を PDF 化したり、印刷したりすることができます。また、ひとつの XML 文書からスタイルシートを変更するだけで異なるレイアウトの PDF を出力することができます。

『AH Formatter』は、お陰様で販売開始から今月で 16年目を迎えました。
今後とも皆様にご愛顧いただけますよう、開発に取り組んでまいります。

 




HTML on Word
WebページをWordで作る!


瞬簡PDF 編集 2024
かんたん操作でPDFを自由自在に編集

簡易マークアップ CAS記法のご紹介(2)

前回(HTMLの簡易マークアップとは。CAS記法のご紹介(1))に引き続き、簡易マークアップとCAS記法のご紹介です。

前回の話:

  • WebページはHTMLで決まっているタグを使って書く。
  • ブログはテキストを自動的にHTMLに変換する。それだけでなく、ビジュアルにHTMLを編集する機能も付いている。
  • HTMLには多数のタグがあり、専門のWeb編集ソフトを使えば、高度なHTMLタグを記述できる。
  • 軽量マークアップ言語はHTMLタグを簡単な記号で表す。

HTMLタグ編集の方法についてみますと、①HTMLタグをビジュアルに入力、②HTMLタグをテキストで直接編集、③HTMLタグを記号で入力する軽量マークアップ言語があります。

軽量マークアップ言語では、Wiki記法とマークダウンが人気をあつめています。

アンテナハウスはCAS記法を提案しています。CAS記法はWiki記法を拡張したものであり、CAS-UBのテキスト編集に利用しています。

CAS-UB記法の簡単な入力例を示します。

markupHighLight-false

CAS記法でテキストにマークアップ

markupHighLight

CAS記法の記号をハイライト表示

html

HTMLタグへの変換例

preview

HTMLのブラウザ表示

軽量マークアップ言語の一番の長所は、テキスト(文字)のみで簡単に入力・編集できることです。欠点は①HTMLタグと記号の関係を新しく覚える必要がある、②あまり高度なタグの入力ができないことでしょうか。

高度なタグというときは、

  • タグの種類を何種類定義できるか?
  • タグの入れ子(親子関係)は、どの程度記述できるか?
  • 属性と属性値は記述できるか?

といった観点があります。 CAS記法で定義するタグの種類、属性と属性値の記述については、CAS記法リファレンスに紹介しています。また、タグのネストについては、「CAS-UBユーザー・ガイド」をご参照ください。

マークダウンは、Wikipediaに簡単な紹介があります:Markdown

詳しい比較は省略しますが、CAS記法は上の3点のどの点から見て、マークダウンよりかなり優れています。もっとも、例えば、表のセル結合はCAS記法でもマークダウンでも表現できません。大局的には50歩100歩かもしれません。

参考資料:
1.マークアップとは (JEPA ebookpedia)
2.書籍編集・制作Webサービス CAS-UB




瞬簡PDF 変換 2024
PDFをOffice文書へ高精度変換


瞬簡PDF 作成 2024
ドラッグ&ドロップでPDF作成

HTMLの簡易マークアップとは。CAS記法のご紹介(1)

2015年10月現在でインターネット利用者のほとんどは、HTML(HyperText Markup Langage)を利用していると思います。しかし、HTMLとはどういうものかを知らない人が大多数ではないでしょうか。

そこで、最初にHTMLとはどんなものか、どうやって書くのかを簡単に説明します。

このブログを始め、ほとんどすべてのWebページはHTMLを使って書き表されています。では、HTMLをどうやって書くのでしょうか?

ブログの場合はテキストを入力すると自動的にHTMLに変換します。ブログで文章を書いて投稿するだけですと、HTMLのことを全く意識しなくても済みます。

もう少し凝って、例えば箇条書きを表現するにはどうしたら良いでしょうか?

このブログシステム(WordPress)はビジュアルモードとテキストモードがあります。ビジュアルモードでは、箇条書きを入力するには、箇条書きのアイコンをクリックします。箇条書きには番号なしリストと番号付きリストがありますが、例えば、番号なしリストを選択してクリックします。

20151016a

そうしますと、次のようなビュレット(箇条書きラベル)が入力されます。

20151016b

ビュレットの後に、文字を入力すると箇条書きになります。

20151016c

テキストモードに切り替えてみますと、この箇条書きの部分は次のようになります。

20151016d

ここに見える、<ul>、<li> がHTMLで定義されるタグというものです。正確には要素型といいます。<ul>は番号のない箇条書きブロックの始まり、<li>は箇条書きの項目の始まり、</li>は項目の終わり、</ul>は箇条書きブロックの終わりを意味しています。

ブログは、だれでも簡単にWebページを書けるようにテキストを自動的にHTMLに変換する仕組み、そうして作成したWebページを簡単に管理する仕組みとして、一つのメディア形態として普及しました。

HTMLでは100種類を超えるタグが定義されており、複雑な構造をもつ内容を記述できます。しかし、ブログでビジュアルに入力できるタグの種類は少なく、HTMLの記述という点では機能的には低いレベルです。もう少し凝ったWebページを作るには、HTMLのタグを直接編集したり、あるいは、HTMLのタグを見せずにWebページをビジュアルに編集する専門的なツール(HTMLエディターなど)を利用します。

HTMLタグを直接編集すると、きめ細かくタグを記述できるのですが、タグの正確な名前や規則(使える位置などの規則)を覚えて使いこなす必要があります。専門的なWeb編集者であればほとんどのタグを知っているはずですが、間違えたりすることもあります。

HTMLのタグを直接入力しないで簡単な記号をタグの代わりに入力して、記号+テキストでWebページを書き表す方法も考案されています。こうした流れの方式を、軽量マークアップ言語(または、簡易マークアップ言語)といいます。具体的には、Wiki記法とかマークダウン(Markdown)という方法が広く利用されています。

Wiki記法はWikiペディアなどで採用されている方法です。マークダウンは、オープンソースソフトのマニュアルの記述などで普及しているようです。

アンテナハウスでは、Wiki記法やマークダウンよりもう少し複雑なタグを記述できるCAS記法を考案しました。CAS記法は、「書籍編集・制作Webサービス CAS-UB」でテキストをマークアップする方法として利用しています。

CAS記法のマークアップ方法とHTMLタグへの対応例は次のWebページにまとめています:CAS記法リファレンス

参考資料:
1.マークアップとは (JEPA ebookpedia)
2.書籍編集・制作Webサービス CAS-UB




瞬簡PDF 変換 2024
PDFをOffice文書へ高精度変換


瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品!

明日開催のAH Formatter事例紹介セミナーのご紹介

既にご存知の方もいらっしゃると思いますが、明日10月16日(金)はAH Formatter 事例紹介セミナー開催日です。開催前日ですが、まだまだ参加申し込み可能です。
今回は事例発表の中でも、DITA に関連する2社の事例発表についてご紹介致します。

1社目は日立金属株式会社様より、社内ドキュメントを DITA にしたその理由と運用の方法について発表して頂きます。DITA のユーザー様による貴重な導入事例の紹介です。実際の運用例を知る事で、DITA がどういうものなのか、イメージを掴んで頂けると思います。

2社目は PFU テクニカルコミュニケーションズ株式会社様より、テキストエディタ等の汎用製品を使用した DITA の導入について発表して頂きます。DITA 導入には莫大な費用が掛かってしまうとお考えの方必見です。

2社共に極めて実践的な DITA の事例発表となっています。DITA を運用されている方、導入を検討されている方はもちろん、検討段階の方から「DITA とは何ですか?」という方まで、満足いただけるセミナー内容となっております。
もちろん、Formatter が DITA 運用でどのように活用されているかも発表して頂きます。

ここまで、(私はDITA 関連営業ですので)DITA 関連の事例発表の紹介しかしていませんが、クレステック様、慶應義塾大学様、ニューキャスト様、プリコ様より事例発表が行われます。Formatter から PDF の活用まで、幅広い活用例をご紹介頂きます。

セミナーへの参加は無料ですが、下記 Web サイトよりお申し込みをお願い致します。
当日のタイムテーブルも掲載していますので、スケジュールの確認にお使いください。
http://www.kokuchpro.com/event/ccc577a122fa377117dc397491ac67a8/




瞬簡PDF 編集 2024
かんたん操作でPDFを自由自在に編集


HTML on Word
WebページをWordで作る!

PDF5-ML

こんにちは。 XML 関連の営業担当です。

マニュアル制作ご担当の方々から注目を集めている DITA ですが、弊社では DITA で書かれたインスタンスを PDF にするためのスタイルシート(DITA Open Toolkit 用のプラグイン)をオープンソースで公開しています。名前を ” PDF5 ” といいます。

DITA Open Toolkit には標準で似たようなプラグインが入っているのですが、残念ながら機能的にしょぼくて、あまり積極的に使いたいと思うようなものではありません。多くの人がまず「日本語が文字化けするんだけど」という問題にぶつかります。 PDF5 ではもちろんこのようなことはないですし、メンテナンス性でも優れていると自負しています。すでに国内外で多くの方に使っていただいています。

そんな “PDF5″ ですが、さらに機能強化したプラグインを先月公開しました。” PDF5-ML “といいます。

” ML ” というのは ” Multiple Language ” の略で、その名のとおり多言語対応を強化したものです。 ひとつの DITA トピックファイルの中に複数言語が混在することがありますが、このような場合でも言語毎のフォント選択をきっちり行うことができます。
DITA 採用時にぜひお試しいただければと思います。

アンテナハウスはこのプラグインのカスタマイズ作業も請け負っております。PDF 生成でお悩みの方はご一報下されば幸いです。

また、このプラグインの勉強会というか説明会を年末ころに開催する計画もありますので、具体化しましたら案内させていただきます。ご期待ください。




HTML on Word
WebページをWordで作る!


瞬簡PDF 編集 2024
かんたん操作でPDFを自由自在に編集
Pages: Prev 1 2 3 ... 24 25 26 27 28 29 30 ... 49 50 51 Next