カテゴリー別アーカイブ: Office文書形式

『Office Open XML Formats入門 第2版』を制作しました

2021年12月07日 16:00~17:00 に「ちょっと一息アンテナハウスウェビナー『Office Open XML Formats入門 第2版』制作報告」を発表しました。販売、公開よりも発表が先になってしまったため、内容が気になっていた方もいらっしゃるのではないでしょうか。

こちらが表紙画像です。

Amazon POD用表紙画像

2021年12月07日ウェビナーのバナー

組版をAH XSL Formatter V7.2で行ったため、『AH Formatter XML関連出版物の紹介』ページに掲載しています。

Amazonの販売ページへのリンクは次の通りです。

https://www.amazon.co.jp/gp/product/4900552836

また、本書のPDF版は弊社オンラインショップからご購入いただけます。印刷版とレイアウトの微調整を行いました。

https://web.antenna.co.jp/shop/html/products/detail.php?product_id=1301

HTML版はOffice Servers資料室のページからご覧いただけます。


ウェビナー概要や書籍紹介ページにある通り、アンテナハウス『Office Open XML Formats入門』の初版は2007年に出版社から刊行されました。
今年は2021年、つまり14年程前の書籍の改訂版ということになります。
内容的な修正は必要とはいえ、以前の版の原稿をベースに新たな版を制作するというとき、XML原稿はほとんど変更が必要ありません。以前の版の構造に不満がある場合はその限りではありませんが。

一方で大規模な修正の余地があるのがXSLTでした。そしてウェビナー(と書籍の後書き)では、XSLTについてはかなり省いて説明することになったため、本記事ともう一度どこかで補足することにしたいと思います。

2007年というのは、XSL的にもそこそこ大きな節目でした。XSLT 2.0のW3C勧告です。XSL 1.1の勧告は2006年でしたが、実利用として熟れていないという点では二者とも同様です。XSLT 2.0以降はミスの発見やスクリプトの見通しにおいてXSLT 1.0とは別言語に近い体験をもたらします。msxmlのXSLTが1.0であることや各ウェブブラウザほか処理系の多くが1.0までしか対応していないことも手伝って、使える状況が限られるのは悩ましいところです。

変更の概略

今回は自社事例でしたので、初版で1.0だったXSLTを3.0に書き換えました(完全に3.0向けに最適化したとはとても言えませんが)。

書籍初版の制作報告にもあったように、XSL 1.1での大きなポイントにbookmarkのとindex関係の語彙が入ったことが挙げられます。『Office Open XML Formats入門』初版では、bookmarkについてはXSL Formatterの拡張仕様、索引についてはbasic-linkとXSLTによる力技による解決が図られていました。

(AH )XSL Formatterの拡張仕様では実際のフローコンテンツ登場箇所と同一の箇所に記述するため、処理においてXML中の章構造に当たったときに同時に処理すれば良いことになります。よってXSLT記述としてはbookmark-tree用に処理を追加するよりも単純に書けます。XSLT 1.0で書く場合は複数回ドキュメントを走査することが難しいということも手伝っていたのかもしれません。

索引構造については、XSL 1.1のindexを導入することで、XSLTで行わなければならなかった処理が簡略化されます。索引語に当たったときの処理で、「既に同じ索引語が登場しているか」「同じ索引語が同ページに登場したときにページ数表示を合一する」といった判別がXSLのプロパティで変更可能になるため、分岐処理などが大幅に簡略化できました。

割とアドホックな書き換えを行っていたり、徹底できていなかったりするため、引き継ぎをするにはリファクタリングが必至ですが、大体このようなことを行いました。

  • テンプレート中に直接書き込まれたattributeをattribute-setへまとめる
  • 共通処理をまとめる。
  • apply-templatesを含まないような分岐は名前付きテンプレートへ追いだし、パラメータを渡すようにする
  • XPathによる値の取得はできるだけテンプレートの先頭でまとめ、利用箇所ではselect="$value"のように呼び出すだけにする

先に書いた通り徹底はできておらず、私自身も、テンプレート中で直接attributeを指定しているような箇所をかなり生み出してしまいました。とはいえ、ギリギリの時期に「ヘッダーの位置をもう少し下げて」といった指示に1行の変更だけで対応できるようにはできたので、無駄ではなかったと思います。

実は上に挙げたものはXSLT 1.0時点でも時間さえあれば行える変更で、3.0への変更には関係ありません。値のみを取得、操作したい箇所をfunction化したり、処理をreplace()関数に書き換えたりといった作業は2.0から行えます。3.0としては関数の括弧が入れ子ではなくarrowを使えたり、文字列結合に「||」を使えるといった枝葉の変更点を使用しています。

参考資料


4月27日(火)16時~ Wordを使う人向けのZoom ウェビナー開催! アウトラインと見出しスタイルについて

来週4月27日火曜日16時からのちょっと一息アンテナハウス・ウェビナーは、「ゼロから学ぼう! Microsoft Wordのスタイル機能・シリーズ -主にアウトラインと見出しスタイルについて-」です。

Wordをいつも使っている人は多いと思いますが、スタイル機能ってわからないなぁと感じることはありませんか? Wordには見出し1、見出し2、…という既製のスタイル(見出しスタイル)があります。これはWordで長めの文書を作るときには大変便利で、スタイルの中で一番よくつかわれると思われます。Wordの見出しスタイルを、既製のまま使うだけではなく、体裁をちょっと変更したり、見出しに番号をつけたり、階層化したり、目次を自動的に作ったりと、使いこなそうとするとなかなかうまくいかないことがありますね。

来週のウェビナーでは、見出しスタイルを使いこなすために知っておきたいことをまとめて解説します。特に、見出しの番号、階層化、目次などに関係深いのはWordのアウトラインという機能です。アウトラインは非常に重要なのにも関わらず、分かりやすい説明は見かけません。

このウェビナーでは、アウトラインとWordの見出しとの関係についての説明を中心に、見出しスタイルの使い方を説明する予定です。2月初めから、本ブログで連載してきた記事を整理したものでもあります。

お時間の余裕のあるかたは、ぜひ、ご視聴ください。きっと、いままで知らなかった知識が得られ、Wordを使うのが楽しくなりますよ。

ちょっと一息アンテナハウス・ウェビナーは、毎月第2、第4火曜日の16時から開催のZoom ウェビナー(無償)シリーズです。どなたでもご参加いただけます。(画像をクリックするとウェビナー予定のページにジャンプします)。

タイトル:ゼロから学ぼう! Microsoft Wordのスタイル機能・シリーズ -主にアウトラインと見出しスタイルについて-
日時:2021年4月27日(火) 16:00〜16:45
概要:Wordにはスタイルという便利な機能があります。Wordのスタイル機能を使うと簡単な操作で統一的なレイアウトの文書を作成できます。
スタイル機能の使い方をマスターすると文書作成をワンランクアップできます。

こちらもご覧になってみてください。
アンテナハウスのMicrosoft Office関連製品と情報一覧ページ(内容充実中)

新着:
Microsoft Wordのアウトラインと見出しスタイルを活用する方法(概要)


ウェビナーでやります!!「LibreOffice VS OSDC 変換ガチンコ対決」

フリーのオフィスソフトとして有名な『LibreOffice』はWord/Excel/PowerPointファイルのPDF変換用としても利用されています。弊社アンテナハウス株式会社も、Office Server Documents Converter(以下、OSDC)という製品で同じようにPDF変換機能を提供しています。

そこで、今回は色々なOfficeファイルを実際に変換した結果を2021年3月23日(火)16:00でのウェビナーで大公開します。【ウェビナーは終了しました】

また、PDF変換以外の機能比較も行ってみます。

  • Microsoft WordからPDFへ変換結果比較
  • Microsoft ExcelからPDFへ変換結果比較
  • Microsoft PowerPointからPDFへ変換結果比較
  • 入力(読込)可能ファイルの比較
  • 出力(書出)可能ファイルの比較
  • I/Fの比較
  • 変換速度の比較
  • ■PDF変換結果比較
    【シンプルな機能チェック(グラフ、表、SmartArtや段組みなど)だけでなく、Webで公開され実際に使用されている】ファイルの変換結果の比較を行います。
    ■入出力可能ファイルの比較
    Office以外のファイルに対応しているのか、しているのであればどの様なファイル形式か、PDF変換以外に画像変換は対応しているか等を比較します。
    ■I/Fの比較
    新規・既存システムへの組み込みに必要なI/Fの種類を比較します。
    ■変換速度比較
    同じファイルセット(10ファイルほど)にどの程度の時間で変換できるかを比較します。
    実際の計測結果を以下に公開します。


    ウェビナー登録ページ【終了しました】

    〒103-0004
    東京都中央区東日本橋2-1-6 東日本橋藤和ビル5F
    アンテナハウス株式会社

    ◆ご購入に関するお問い合わせ(祝日を除く月~金曜日9:30~18:00)

    TEL:
    03-5829-9021
    FAX:
    03-5829-9023
    E-mail:
    sis@antenna.co.jp


Wordに埋め込まれたイメージ画像の解像度はどうなるか? Word2019の場合

2017年に、CASブログで、「Wordに埋め込まれたイメージ画像の解像度はどうなるか?」という記事を書きました[1]。OSDCのページの記事[2]は、この結果をもとにしています。それらの記事で書いたことを簡単にまとめると次の3点になります。

1.Word2013の内部では、イメージ画像の保存方法に旧形式(VMLのシェープ形式)と新形式(OOXMLのシェープ形式)がある。

2.イメージ画像をWord2013の編集画面にドラッグ&ドロップすると旧形式で保存され、コピー&ペーストまたは挿入―画像で埋め込むと新形式で保存される。

3.Wordの編集画面でイメージ画像のレイアウト上の大きさ(表示サイズ)を変更したとき、Word文書ファイルの内部に保存されているイメージ画像の大きさ(縦と横のピクセル数で表す解像度)がWordによって変更されることがある。その扱いが旧形式と新形式で異なっており、イメージ画像の解像度をWordが変更してしまうことを避けるには、それなりの設定をしておく必要がある。

最近、イメージ画像を含む原稿をWord2019で作成していて次のことに気が付きました:
Word2019の編集画面で、ドラッグ&ドロップでイメージ画像を配置して文書を作成し、その文書ファイルの内部をみると、イメージ画像が新形式で保存されています。つまり、Word2019で新しく文書を作るとき、イメージ画像の埋め込みには旧形式は使わないようになっています。

いつまでも昔の形式を使い続けるはずはないので考えてみれば当たり前のことですが。では、Word2019の文書ファイル内部では旧形式が廃止になったかというとそんなことはないようです。Word2013でドラッグ&ドロップで埋め込んだイメージ画像を持つWord2013の文書を、Word2019で読んでも、そのイメージ画像は依然として旧形式のまま扱われるようです。つまり、Word2019は、旧形式で保存された画像の編集機能も持っています。

実際に試してみました。次の画面はWord2019 の編集画面のリボン「図ツール」の書式タブです。上がWord2013で作成した文書を、Word2019で開いて(旧形式の)イメージ画像をダブルクリックしたときに表示されるリボンのタブ、下がWord2019で作成した新形式のイメージ画像をダブルクリックしたときに表示されるリボンのタブです。

両方ともWord2019のリボンのタブですが、これをみると、Word2019の編集画面では、同じように見えるイメージ画像でも、内部での画像の持ち方によって表示されるコマンドが異なっていることがわかります。

イメージ画像のWord2019中でのサイズ

Word2019では、ドラッグ&ドロップ、コピー&ペースト、リボンの「挿入」―「画像」のいずれの方法でもイメージ画像は同じ扱いとなります。デフォルト設定で、イメージ画像のサイズは既定の解像度を適用して圧縮[3]されます。次はリボン「図ツール・書式」タブの「図の圧縮」コマンドのデフォルト設定です。

既定の解像度は、「オプション」の「詳細設定」タブの「イメージのサイズと画質」で設定されます(次の図)。デフォルト設定では、既定の解像度は220ppiとなっています。

実際に試してみました。

まず、横2448×縦3264ピクセルのJPEG画像を用意して、Word2019の画面にドラッグ&ドロップします。画面上の幅は、図のように150mmとなっています。

画像の横ピクセル数を計算すると次のようになるはずです。

横150mm×220ppi/25.4(mm/inch)=1299pixcel

Word2019のファイルの内部を見ると、次のようにJPEG画像ファイルは、横ピクセル数が1298となっていました。1ピクセルの誤差がありますが、ほぼ計算通りです。この図は対象Word2019文書の内部を表示したものです。

関連記事

[1] Wordに埋め込まれたイメージ画像の解像度はどうなるか?

[2] Office Server Document Converter Word文書(docx文書)に埋め込まれたイメージ画像はどのように扱われているか

[3] 圧縮という用語にはいろいろな意味があるので、正確にはダウンサンプリングというべきでしょう。

[4] 用紙A4(幅210mm)で左右余白各30mm。

[5] Word文書構造については次をご参照ください:
Office Server Document Converter Office Open XML (OOXML) とは? 概要、メリットと活用アプリケーション