タグ別アーカイブ: マークアップ

あらゆる文書には構造がある?

原稿に見出しをつけると、階層構造が分かりやすくなって読み易くなります。というようなことを前回書きました。⇒構造化文書とは何か?

構造化文書をつくるときは、あらかじめ構造を規定し、その構造に従って文書を編集します。では、逆に普通に書かれた任意の文書を構造化できるでしょうか?

編集者の仕事についての本を読みますと、原稿には、内容順序(前付・本文・後付など)があり、また、一般の著作物では、章・節・項というような構成があり、大見出し・中見出し・小見出しをつけて整理するとあります。(『原稿編集ルールブック』日本エディタースクール、2005年3月11日、p.8 C項による)。

そうしますと、著作物の多くは、内容順序や階層の構成をもたせることができるはずです。こうして整理された原稿には整理したような構造があるといえます。

著者から提出された原稿をもとに、内容順序や階層化した見出しを付けるのは編集者の仕事のひとつでしょう。出版に値する原稿の多くは、こうした整理ができるでしょうから、あらゆる文書には構造がある、とはいえないにしても、出版された文書にはそれなりの構造がある、といえるでしょう。

さて、文書に、こうした構造を付与したのが原始的なマークアップです。⇒マークアップとは

しかし、このような原始的なマークアップでは、原稿=文書毎にばらばらに、アドホックになってしまいます。1冊ずつ本を作るにはこれでもいいでしょうが、工学的に扱うには不十分または不経済です。

これを科学的=工学的に行うことを考えるのが、構造化文書の技術です。そのためには、マークアップ方法のルール化、次に標準化が必要でしょう。


構造化文書とは何か?

新年、明けましておめでとうございます。

弊社では、2016年の課題のひとつとして、構造化文書の普及促進に重点的に取り組む予定です。構造化文書とは、文書の構造をマークアップした文書のことです。

では、文書の構造とはなんでしょうか? どんな意義があるのでしょうか?

文書構造の一つに、階層構造があります。2015年の暮れにJEPAのebookpediaで「階層構造とは」という用語解説が発表されました。この用語解説は人気抜群なのだそうです。

ebookpedia「階層構造とは」

主に電子書籍の階層構造について説明したものですが、簡単に整理すると次のようになるでしょう。

1.階層構造とは、章・節・項のような、つまり、大見出し、中見出し、小見出しのような見出しをつけること

2.階層構造は、XHTMLの<section>, <h1>~<h6>のようなタグで付ける。

3.階層構造の見出しによって、文章の持つ意味や重要度を差別化でき、読み手に意味の重要度が伝わる。また、目次を作ることができる。

4.タグに対して、スタイルシート(CSS)で重み付けと視覚的表現を紐づける。CSSを書き換えることで、見出しの色やフォントを切り替えられる。

この用語説明で、階層構造とはなにか? どんな意義があるかが大雑把に分かります。電子書籍のような簡単な出版物では、この程度の理解で十分かもしれません。しかし、電子書籍についていえば、eboookpediaでも少し触れられていますが、階層構造のような簡単な概念さえ、様々な見解があって必ずしも完全に合意されているわけではないようです。

文書の著者・編集者・制作者は、何らかの構造を念頭に置いているでしょう。これを暗黙ではなくて、明示的なルールでマークアップしたときに、構造化文書となります。タグはマークアップ手段のひとつです。

ところで、階層化以外の構造もあります。例えば、DITA(Darwin Information Architecture)では、技術文書を対象にして、構造についてもっと高度に定義しています。高度な構造は作成に手間がかかりますが、それなりの効果もあります。DITAにおける構造については、後日別途検討する予定です。

続きは:
1. あらゆる文書には構造がある?
2. 多くの文書は目的に応じた構造を持つ。その構造を明示化したのが構造化文書

関連ブログ(CASブログ)
CAS記法のマークアップがなぜ必要なのかー図版とキャプションの例
コンテンツの構造化とは何か? 構造化の目的、手段は? Word文書のスタイル付けとマークアップの関係

[参考資料](用語解説)
1.マークアップとは
2.DITA


HTMLの簡易マークアップとは。CAS記法のご紹介(1)

2015年10月現在でインターネット利用者のほとんどは、HTML(HyperText Markup Langage)を利用していると思います。しかし、HTMLとはどういうものかを知らない人が大多数ではないでしょうか。

そこで、最初にHTMLとはどんなものか、どうやって書くのかを簡単に説明します。

このブログを始め、ほとんどすべてのWebページはHTMLを使って書き表されています。では、HTMLをどうやって書くのでしょうか?

ブログの場合はテキストを入力すると自動的にHTMLに変換します。ブログで文章を書いて投稿するだけですと、HTMLのことを全く意識しなくても済みます。

もう少し凝って、例えば箇条書きを表現するにはどうしたら良いでしょうか?

このブログシステム(WordPress)はビジュアルモードとテキストモードがあります。ビジュアルモードでは、箇条書きを入力するには、箇条書きのアイコンをクリックします。箇条書きには番号なしリストと番号付きリストがありますが、例えば、番号なしリストを選択してクリックします。

20151016a

そうしますと、次のようなビュレット(箇条書きラベル)が入力されます。

20151016b

ビュレットの後に、文字を入力すると箇条書きになります。

20151016c

テキストモードに切り替えてみますと、この箇条書きの部分は次のようになります。

20151016d

ここに見える、<ul>、<li> がHTMLで定義されるタグというものです。正確には要素型といいます。<ul>は番号のない箇条書きブロックの始まり、<li>は箇条書きの項目の始まり、</li>は項目の終わり、</ul>は箇条書きブロックの終わりを意味しています。

ブログは、だれでも簡単にWebページを書けるようにテキストを自動的にHTMLに変換する仕組み、そうして作成したWebページを簡単に管理する仕組みとして、一つのメディア形態として普及しました。

HTMLでは100種類を超えるタグが定義されており、複雑な構造をもつ内容を記述できます。しかし、ブログでビジュアルに入力できるタグの種類は少なく、HTMLの記述という点では機能的には低いレベルです。もう少し凝ったWebページを作るには、HTMLのタグを直接編集したり、あるいは、HTMLのタグを見せずにWebページをビジュアルに編集する専門的なツール(HTMLエディターなど)を利用します。

HTMLタグを直接編集すると、きめ細かくタグを記述できるのですが、タグの正確な名前や規則(使える位置などの規則)を覚えて使いこなす必要があります。専門的なWeb編集者であればほとんどのタグを知っているはずですが、間違えたりすることもあります。

HTMLのタグを直接入力しないで簡単な記号をタグの代わりに入力して、記号+テキストでWebページを書き表す方法も考案されています。こうした流れの方式を、軽量マークアップ言語(または、簡易マークアップ言語)といいます。具体的には、Wiki記法とかマークダウン(Markdown)という方法が広く利用されています。

Wiki記法はWikiペディアなどで採用されている方法です。マークダウンは、オープンソースソフトのマニュアルの記述などで普及しているようです。

アンテナハウスでは、Wiki記法やマークダウンよりもう少し複雑なタグを記述できるCAS記法を考案しました。CAS記法は、「書籍編集・制作Webサービス CAS-UB」でテキストをマークアップする方法として利用しています。

CAS記法のマークアップ方法とHTMLタグへの対応例は次のWebページにまとめています:CAS記法リファレンス

参考資料:
1.マークアップとは (JEPA ebookpedia)
2.書籍編集・制作Webサービス CAS-UB