タグ別アーカイブ: XPath

XSLTを学ぶ　（4）式の構成部品としてのパスの使い方

前回^[1]はパス（ロケーションパス）の構成法を学びました。続いてパスの使い方を調べてみます。

スタイルシートで重要な役割を果たす要素の一つにxsl:apply-templatesがあります。XSLT^[2]の5.4 Applying Template Rulesを見ますと、xsl:apply-templatesの定義は次のようになっています。

<xsl:apply-templates
　select = node-set-expression
　mode = qname>
　<!– Content: (xsl:sort | xsl:with-param)* –>
</xsl:apply-templates>

select属性を省略すると、xsl:apply-templatesはカレントノードのすべての子供を処理します。select属性の値に式を記述することで、処理対象とするノードの集合を限定できます。この式はどのように評価されるのでしょうか？

XSLTの5.1 Processing Modelを読むと、ノードにmatchするテンプレート規則の中から、あるテンプレート規則が選択されると、テンプレート規則はそのノードをカレントノードとして起動されるとあります。

本書^[3]には次のような例（2.18の一部）が出ています。

<xsl:template match=”body”>
　<fo:page-sequence master-reference=”main”>
　　<fo:flow flow-name=”xsl-region-body”>
　　　<xsl:apply-templates select=”p”/>
　　</fo:flow>
　</fo:page-sequence>
</xsl:template>

<xsl:template match=”p”>
　<fo:block>
　　<xsl:apply-templates/>
　</fo:block>
</xsl:template>

最初のブロックのテンプレート規則（xsl:template）は、（要素ノード）bodyにmatchしています。従って、最初のブロックではbodyがカレントノードです。

XPath^[4]の式は文脈ノードで評価されます。XSLTの4 Expressionsを見ますと、最も外側の式（ある式の一部でない式）は文脈を次のように取得します。

a. 文脈ノードはカレントノードから
b. 文脈ノードの位置は、カレントノードリストにおけるカレントノードの位置から
c. 文脈ノードの大きさは、カレントノードリストの大きさから

こうして、最初のxsl:apply-templatesのselect属性の値である式p（child::pの省略記法）の文脈ノードはbodyになることが分かります。こうしてselect属性によりbodyの子であるpを選択したノード集合を作ることになります。（bodyの子のpではない要素ノードや、bodyの兄弟p要素ノードは対象になりません）。

[1] XSLTを学ぶ　（3）パスとは
[2] XSL Transformations (XSLT) Version 1.0
[3] 『スタイルシート開発の基礎』
[4] XML Path Language (XPath) Version 1.0

【広告】★AH Formatter XML関連出版物の紹介

次回:
XSLTを学ぶ（5）パターンの記述のためのパス

前回:
XSLTを学ぶ　（3）パスとは

初回:
XSLTを学ぶ（1）XMLのツリーモデルとXPath/XSLTのツリーモデルではルートの意味が違う

投票をお願いいたします

瞬簡PDF 書けまっせ 2024
PDFに文字が書ける！入力欄を自動認識

瞬簡PDF 変換 2024
PDFをOffice文書へ高精度変換

XSLTを学ぶ　（3）パスとは

現在、5月にPOD出版した『スタイルシート開発の基礎』^[1]を使って、毎週、社内で勉強会をしています。先週は第2回目でしたが、3.4.1 パス(p.21)の箇所で人によっては結構ひっかかりました。

本書はXMLをXSL-FOで本にするということがテーマなので、XSLTの基本説明はさっと流しています。詳しいことはあとで、実際に使えれば良いという実践的な指導書ともいえます。でもわからないことは詳しく調べてみるのも面白いものです。ということで、このあたりを少し調べてみました。

まず、パスについて調べてみます。XPath仕様^[2]を見ますと、パス（ロケーションパス）の生成規則では、次のように絶対パスと相対パスの２種類があります。

LocationPath ::= RelativeLocationPath | AbsoluteLocationPath

絶対パスは次のように相対パスの先頭が’/’（ルートノード）になっているものです。

AbsoluteLocationPath ::= ‘/’ RelativeLocationPath? | AbbreviatedAbsoluteLocationPath

相対パスは次のように単一のステップまたは複数のステップを’/’で結合して構築します。

RelativeLocationPath ::= Step | RelativeLocationPath ‘/’ Step | AbbreviatedRelativeLocationPath

‘/’の意味が場所によって違うことで混乱しがちですが、先頭に’/’があったら、それはルートノードを意味し、ステップの間の’/’は結合用オペレータです。

ステップの生成規則は次のようになっています。

Step ::= AxisSpecifier NodeTest Predicate* | AbbreviatedStep

つまり、ステップの記述方法には省略記法（AbbreviatedStep）と軸指定から始める書き方（AxisSpecifier NodeTest Predicate*で構成する）の二通りがあります。本書の3.4.1パスには省略記法、3.4.2軸には軸指定から始める記法の例が載っています。

前回（^[4]）の図のp要素を含むパスは、省略記法では

絶対パス：/doc/body/p
相対パス：body/p

という二種類の書き方があります。これだけですと、WebのURLなどのパスの書き方と似ています。しかし、軸指定から始める書き方では、次のようになり違いが明確です。

絶対パス：/child::doc/child::body/child::p
相対パス：child::body/child::p

【注意】pを含む相対パスは、起点の取り方により、上記以外にもいろいろ書けます。

属性ノードも指定できます。軸から書くとき、例えば次のようになります。

絶対パス：/child::doc/child::body/child::p/attribute::s
相対パス：child::body/child::p/attribute::s

attribute:: は省略記法では@になります。

テキストノードは次のように指定できます。

絶対パス：/child::doc/child::body/child::p/child::text()
相対パス：child::body/child::p/text()

すべての子要素ノードを表すときは次のようにも書けます。

絶対パス：/child::doc/child::body/child::*
相対パス：child::body/child::*

ここで述べたロケーションパスは式の構成要素となります（本書3.4.4）。他にパタン（本書3.7.1）としてのパスもあります。本書ではあまり詳しく書いてありませんが^[4]、Micheal Kayさんの本によれば、第一と第二ではパスの意味合いが違うようです。もう少し詳しく調べてみます。

[1] 『スタイルシート開発の基礎』
[2] XML Path Language (XPath) – W3C
[3] XSLTを学ぶ　（１） XMLのツリーモデルとXPath/XSLTのツリーモデルではルートの意味が違う
[4] XSLTを学ぶ　（2）ノードツリーとノードの親子、子孫関係
[5] なんども書きますが、本書はXSLTやXPathそのものを詳しく学ぶ本ではありません。

【ご注意】筆者はXSLTを勉強中です。ここに書いた内容は、資料を調べながら正確を期していますが、間違いを含んでいる可能性もありますので、ご注意ください。

次回:
XSLTを学ぶ（4）式の構成部品としてのパスの使い方

前回:
XSLTを学ぶ　（2）ノードツリーとノードの親子、子孫関係

初回:
XSLTを学ぶ（1）XMLのツリーモデルとXPath/XSLTのツリーモデルではルートの意味が違う

投票をお願いいたします

瞬簡PDF 作成 2024
ドラッグ＆ドロップでPDF作成

瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品！

XSLTを学ぶ　（１） XMLのツリーモデルとXPath/XSLTのツリーモデルではルートの意味が違う

先月『スタイルシート開発の基礎』^[1]という本を出版しました。この本は、副題に「XMLとFOで簡単な本を作ってみよう」とあるとおりXSLTの実践学習本です。現在、弊社の社内でも、初心者が集まって、この本を使ってXSLTの学習をはじめたところです^[2]。私もメンバーの一人です。

『スタイルシート開発の基礎』のはじめにには「XSLT/XPathの知識はない」人が本書の対象とあります。私もXSLTを本格的に学ぶのは初めてですので、本書の想定読者にあてはまりそうです。

素直に読めば、この本だけで理解できるのかもしれませんが、折角ですので、他の参考資料や仕様書をにらみ合わせて楽しみながらお勉強。そこで、折角学んだことを整理して、紹介したいと思います。すでにご存知の方には、初歩的なお話と思いますが、『スタイルシート開発の基礎』の補足として役立てていただけるかもしれません。

資料としては次を見ています。

・『XSLTバイブル』（Michael Kay著、インプレス社、2002年1月発行）
・XSL Transformations (XSLT) Version 1.0（W3C Recommendation 16 November 1999）^[3]
・XML Path Language (XPath) Version 1.0（W3C Recommendation 16 November 1999, revised 7 September 2015）^[4]

さて、今回勉強し始めて知ったのですが、整形式XMLのツリーモデルとXSLT／XPathのツリーモデルはまったく違うんですね。

XML1.0では、整形式XML文書はルートが文書の実体ツリーの起点であり、XMLプロセサはルートから処理を始めます。さらに見ますと、ルートまたは文書要素と呼ばれる要素が唯一あるとされています。ルート要素は他の要素の内容になりません（つまり親を持ちません）が、他の要素は親を持ちます^[5]。整形式XML文書はルート要素（文書要素）を起点とする要素のツリー構造になります。

しかし、XPathのデータモデルは、ノードという概念が中核です。ノードの種類として次の7つがあります。
・ルートノード（root nodes）
・要素ノード（element nodes）
・テキストノード（text nodes）
・属性ノード（attribute nodes）
・名前空間ノード（namespace nodes）
・処理命令ノード（processing instruction nodes）
・コメントノード（comment nodes）

原文でroot nodesと複数形になっているのが気になりますが、XPath仕様の5.1 ルートノード（Root Node）には、「ルートノードはツリーのルートであり」、「文書要素ノードはルートノードの子である」、「ルートノードの子供として、処理命令、処理命令のためのコメント、プロローグの中の文書要素の後のコメントノードがある。」とあります。

また、XSLT仕様の3 データモデル（Data Model）を見ますと、XSLTでは、ソース文書、スタイルシート、結果文書に同じデータモデルを使います。それらはXPathのデータモデルを基本として、少しだけ変更したものです。

・整形式のソースXML文書を読み込んでソースツリーを構築するときは、ルートノードの下にテキストノードはなく、唯一の要素ノードを子として持ちます。また、DOMなどの他の方法でソースツリーを作るときは、ソースツリーに対する制約は結果ツリー同様に緩められます。

・文書スタイルシートのツリーを構築するときは処理命令とコメントノードを無視します。

・結果ツリーでは、ルートノードへの制約が緩められており、子供として要素ノードを含む、任意のノードの系列をもつことができます。これにより、整形式XMLでない出力を作ることができます。

ですので、たぶん、XSLTでは整形式でないようなソースXMLでも処理できそうです^[5]。

[1] 『スタイルシート開発の基礎』
[2] アマゾンPODの便利な利用法
[3] XSL Transformations (XSLT) Version 1.0
[4] XML Path Language (XPath) Version 1.0
[5] Extensible Markup Language (XML) 1.0 (Fifth Edition) 2 Documents
[6] 余談です。『スタイルシート開発の基礎』の著者（神様）に、Michael Kayさんの本にそんなことが書いてある、と話しましたら、仕様書のどこに書いてあるかを示せ！　と言われました。それは、3.1 Root Node Childrenの二つ目の段落の後半のセンテンスにあります。

次回:
XSLTを学ぶ（2）ノードツリーとノードの親子、子孫関係

投票をお願いいたします