カテゴリー別アーカイブ: AH Formatter

Breaking Paragraphs into Lines

Breaking Paragraphs into Lines は、Donald E. Knuth と Michael F. Plass の行分割に関する論文で、40年近く前のものです。ここで示されているアルゴリズムは、パラグラフ全体を Box/Glue/Penalty という要素(Paragraph Item)でモデル化して、行分割位置を決定するものです。処理の流れは次のようになります。

  1. アプリケーションが、文書から Paragraph Items を構築する。
  2. 分割可能位置に対して、そこで行分割したときの不具合度を示すデメリット値と呼ばれる値を計算する。
  3. もっともデメリット値の合計の少ない位置を選択し、行分割位置とする。

Paragraph Item の要素 Box/Glue/Penalty は、それぞれが幅を持っています。

  • Box は常に幅が確保される。伸縮性はない。
  • Glue も幅が確保されるが、そこで分割が起こったとき幅がなくなる。Glue には伸縮性がある。
  • Penalty はその逆で、通常は幅が確保されないが、そこで分割が起こったとき前の行末にその幅が確保される。Penalty に伸縮性はない。また、行分割の起こり易さを調整するペナルティ値という値を持っており、分割不可では ∞ を、分割必須では −∞ を与えることになっている。 ハイフネーションは Penalty を利用して実現されている(通常の Penalty と区別するために Flagged Penalty と呼ばれる)。

次のような文書(論文に出てくるグリム童話)を例に、このアルゴリズムがどのように行分割位置を決定するのかをざっと見てみましょう。

fig-12

これから次のような Paragraph Items が構築されます。
x は要素、t は要素の種別、w は要素の幅、y は伸ばせる幅、z は縮められる幅、p はペナルティ値を示しています。

x0 empty box for indentation t0 = box w0 = 20
x1 box for ‘In’ t1 = box w1 = 17.44
x2 glue for space U+0020 t2 = glue w2 = 4.54 y2 = 5 z2 = 2
x3 box for ‘old’ t3 = box w3 = 25.68
x4 penalty for hyphenation t4 = flagged-penalty w4 = 7.12 p4 = 100
x5 box for ‘en’ t5 = box w5 = 19.44
x6 glue for space U+0020 t6 = glue w6 = 4.54 y6 = 5 z6 = 2
x7 box for ‘times’ t7 = box w7 = 43.7
x8 glue for space U+0020 t8 = glue w8 = 4.54 y8 = 5 z8 = 2
x9 box for ‘when’ t9 = box w9 = 43.88
......
x24 glue for space U+0020 t24 = glue w24 = 4.54 y24 = 5 z24 = 2
x25 box for ‘lived’ t25 = box w25 = 38.54
x26 glue for space U+0020 t26 = glue w26 = 4.54 y26 = 5 z26 = 2
x27 box for ‘a’ t27 = box w27 = 8.78
x28 glue for space U+0020 t28 = glue w28 = 4.54 y28 = 5 z28 = 2
x29 box for ‘king’ t29 = box w29 = 35.5
x30 glue for space U+0020 t30 = glue w30 = 4.54 y30 = 5 z30 = 2
x31 box for ‘whose’ t31 = box w31 = 50.64
......
x51 box for ‘young’ t51 = box w51 = 49.76
x52 penalty for hyphenation t52 = flagged-penalty w52 = 7.12 p52 = 100
x53 box for ‘est’ t53 = box w53 = 21.84
x54 glue for space U+0020 t54 = glue w54 = 4.54 y54 = 5 z54 = 2
x55 box for ‘was’ t55 = box w55 = 29.82
x56 glue for space U+0020 t56 = glue w56 = 4.54 y56 = 5 z56 = 2
x57 box for ‘so’ t57 = box w57 = 17.7
x58 glue for space U+0020 t58 = glue w58 = 4.54 y58 = 5 z58 = 2
x59 box for ‘beau’ t59 = box w59 = 38.36
x60 penalty for hyphenation t60 = flagged-penalty w60 = 7.12 p60 = 100
x61 box for ‘ti’ t61 = box w61 = 11.56
x62 penalty for hyphenation t62 = flagged-penalty w62 = 7.12 p62 = 100
x63 box for ‘ful’ t63 = box w63 = 21.82
......
x143 box for ‘old’ t143 = box w143 = 25.68
x144 glue for space U+0020 t144 = glue w144 = 4.54 y144 = 5 z144 = 2
x145 box for ‘lime-‘ t145 = box w145 = 42.34
x146 penalty for inter-word t146 = flagged-penalty w146 = 0 p146 = 100
x147 box for ‘tree’ t147 = box w147 = 30.46
x148 glue for space U+0020 t148 = glue w148 = 4.54 y148 = 5 z148 = 2
x149 box for ‘in’ t149 = box w149 = 16.3
......
x267 box for ‘her’ t267 = box w267 = 26.52
x268 glue for space U+0020 t268 = glue w268 = 4.54 y268 = 5 z268 = 2
x269 box for ‘fa’ t269 = box w269 = 14.7
x270 penalty for hyphenation t270 = flagged-penalty w270 = 7.12 p270 = 100
x271 box for ‘vor’ t271 = box w271 = 26.48
x272 penalty for hyphenation t272 = flagged-penalty w272 = 7.12 p272 = 100
x273 box for ‘ite’ t273 = box w273 = 19.6
x274 glue for space U+0020 t274 = glue w274 = 4.54 y274 = 5 z274 = 2
x275 box for ‘play’ t275 = box w275 = 33.42
x276 penalty for hyphenation t276 = flagged-penalty w276 = 7.12 p276 = 100
x277 box for ‘thing.’ t277 = box w277 = 47.02
x278 finishing glue t278 = glue w278 = 0 y278 = ∞ z278 = 0
x279 forced break t279 = flagged-penalty w279 = 0 p279 = −∞

次の位置が分割可能位置となります。上の例では、x2、x4 などです。

  1. xb が Penalty であり pb < ∞ である xb
  2. xb が Glue であり xb-1 が Box である xb

デメリット値は、そこで行分割するとどの程度よろしくないのかを示す値であり、この値が小さいほどよい分割位置と判断されます。 あまりに大きなデメリット値のときは分割位置の候補から除外されます。 デメリット値の算出方法の詳細はここでは触れませんが、外部から与えるいくつかのパラメタによって、デメリット値を調整できるようになっています。

上の例では、x2 や x4 のデメリット値は非常に大きく、候補から除外されます。最初(1行目)の分割位置候補となるのは x26 と x28 で、デメリット値を d とすると、d26 = 975.065、d28 = 23.5004 となっています。
x26 で行分割したとき、次の行(2行目)の分割位置候補は、x52 と x54 で、d52 = 29412.2、d54 = 1288.3 です。
x28 で行分割したときは、x56 と x58 が次の候補となり、d56 = 24.6185、d58 = 6446.52 です。
パラグラフ全体にこれを繰り返すと、次のようなネットワークができ上がります(パスのいくつかは省略されています)。数値は、下に示された語の後で分割したときのデメリット値を示しています。この例では、太い枠の語で分割するのが最良となっています。

fig-12-network

 

現在の AH Formatter はこのアルゴリズムを利用していません。そこで、このアルゴリズムを利用すると、どのように行分割位置が変化するのかを見てみます。

AH Formatter の結果 — ハイフネーションなし
V6-1
Knuth-Plass アルゴリズム の結果 — ハイフネーションなし
V7-1

これは、行あたりの単語数の少ない文書です。つまり、分割可能位置が少ない。 行末のアキの幅がより均等に近いのは、Knuth-Plass アルゴリズム の方であるのが見て取れます。

ハイフネーションをしたときは次のようになります。

AH Formatter の結果 — ハイフネーションあり
V6-2
Knuth-Plass アルゴリズム の結果 — ハイフネーションあり
V7-2

AH Formatter はハイフネーションが多く発生しています。
Knuth-Plass アルゴリズム は、ハイフネーションの発生を少なく抑えるように作られていますが、パラメタを調整して、もう少しハイフネーションが起こり易くすると、次のようにもなります。

Knuth-Plass アルゴリズム の結果 — ハイフネーション多め
V7-2a

行あたりの単語数が多いときは分割可能位置も多いので、結果に差はなくなってきます。

AH Formatter の結果 — ハイフネーションなし
V6-3
Knuth-Plass アルゴリズム の結果 — ハイフネーションなし
V7-3

Knuth-Plass アルゴリズム には、いろいろ制約があることがわかっています。例えば以下のようなものです。

  • 空白によって分かち書きされる英語などの文書を想定しているので、日本語のように分かち書きせず、ほとんどの文字間で分割可能な言語のことは考慮されていない。
  • 非矩形の領域を扱えるが、そのとき行の高さが一定であることが仮定されている。つまり、途中で大きな文字が入っていたりすると処理できない。
  • ドロップキャップ、letter-spacing、カーニング、リガチャ、綴りの変化するハイフネーション、ルビなどは考慮されていない。
  • ページ分割は処理しないので、widows/orphans は処理できない。

AH Formatter にこのアルゴリズムを導入することが検討されています。

 




アウトライナー
PDFを解析して しおり・目次を自動生成


瞬簡PDF 編集 2024
かんたん操作でPDFを自由自在に編集

EPUBtoPDF変換ツールを使ってみる(Formatter最新バージョン対応)

ご無沙汰しております。
本日と明日のブログは、電子出版サービスグループからお送りいたします。

Formatter 最新バージョンに対応

「EPUBtoPDF変換ツール」は、ときどき、地味に引き合いがあります。EPUBをPDFにするという需要自体が、まだまだ少ないので引き合いが少ないのはやむを得ないところです。製品の方も少しずつですが、バージョンアップしています。

今回、AH Formatterのバージョンアップ(V6.6MR1)に合わせて同バージョンに対応しました。劇的な変化はありませんが、昨今の縦組み横組み混じりのEPUBも、そのとおりにPDF変換できますし、CSSからのページ組版上、行間のアキ処理で不自然に1,2行ほどページの最後の行が空いてしまう問題も、軽減しました。

  • 縦組みの中に横組みのページがある場合のパラメータ設定:mixed-writing-mode=”true”
  • ページ最後の空白軽減のパラメータ設定:baseline-grid=”true”

ただし、ページ最後の空白軽減については、行数(lines)が指定されているものに限ります。行数が設定されていない場合は無効ですのでご注意ください。

 

EPUBの本文と奥付

PDF変換してみる

上図は、EPUBの本文が縦書き、奥付を横組みに設定した例です。その下の図は、EPUBtoPDF変換ツールを使い、PDF変換してみた例です。
(出典:青空文庫-幸福のうわおい靴)

※余白等デザインがよろしくないのは、このためだけに作った見本EPUB/PDFなので、単純にCSSやツール側のパラメータ設定をしていないだけです。

これで、小洒落た(?)デザインのEPUBも、まずまずの出来具合でPDF変換が可能になりました。

「EPUBtoPDF変換ツール」はライセンスの販売のみではなく、これを使った変換サービスも承ります。EPUBの校正のためにPDFにしている版元さんもいらっしゃいます。EPUBから紙書籍の出版を考えている版元様、制作会社様、このままPDF入稿もできればイメージを掴むための校正用としてもご利用いただけますので、ぜひお問い合わせください。

「EPUBtoPDF変換ツール」のご紹介ページ

<お問い合わせ先>
電子出版サービスグループ:cas-info@antenna.co.jp




瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識


瞬簡PDF 変換 2024
PDFをOffice文書へ高精度変換

FormatterでA3横サイズのPDFをA4縦サイズ2ページに分割してみる

昨日に引き続き、Formatterの普段とはちょっと違った使い方第三弾です。

すでにA3横サイズで作ってしまったPDFをA4縦サイズ2ページに分割したいことってありませんか?
だいぶ前にお客様からそういうご要望をいただいたことがあります。次のような新旧比較表でした。

これを次のようにA4見開きにしたいわけです。

いろいろと考えた挙句、次のようにすることにしました。

1. A3横サイズの左側だけをトリミングしてA4縦のページに乗っける絵にすると次のようなイメージです。

2. A3横サイズの右側だけをトリミングしてA4縦の次のページに乗っける絵にすると次のようなイメージです。

スタイルシート的にはこんな感じ

分かりにくい説明で申し訳ありません。
ご興味のある方は是非ご一報を! 詳しく説明させていただきます。




瞬簡PDF 編集 2024
かんたん操作でPDFを自由自在に編集


瞬簡PDF 作成 2024
ドラッグ&ドロップでPDF作成

Formatterで画像やテキストを重ね書きしてみる

以前このブログの「FormatterでMathMLをPDFにしてみる」という記事でFormatterの普段とはちょっと違った使い方の紹介をしましたが、今日はその第二弾です。

たとえば次のようなXMLがあったとします。

そうすると

こんな感じにいつもとは違ったちょっとポップなPDFができちゃいます(もちろん別途XSLTスタイルシートは必要ですが)。

自動組版というよりはDTPソフトっぽい使い方ですね。テキストの部分にはFormatterの機能でドロップシャドーを付けてみました。

工夫すれば頻繁に更新するチラシや優待券みたいなものも作れるかもしれません。




瞬簡PDF 編集 2024
かんたん操作でPDFを自由自在に編集


瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識

海外出展情報 その2

近年では、自己出版、電子書籍、ウェブ制作に重点が置かれています。 それでもまだ、イベントでは紙の本が中心的な存在でした。

Digital Book World 2018

今年のDigital Book World(10月2-4日開催)は、いつもの展示会とは少し異なって、オーナーが替わり、出展会場が替わり、また焦点となるテーマにも変化がありました。 以前は、Digital Book Worldカンファレンスは、電子書籍、その関連技術、および既存のコンテンツを電子形式に移行するための最良の方法を理解する目的でユーザーが参加できる数少ない会議の1つでした。 しかし、長年にわたって人々の関心は減少方向にありました。 その結果、F&W Media publishingは、2017年にScore Publishingにこの展示会を売却しました。Score Publishingは、他にiBooks Author Conferenceもプロデュースしています。

今まで開催してきたニューヨーク市に替わって、Digital Book Worldはナッシュビル・テネシー・ミュージックシティ・コンベンションセンターに移転しました。 コンベンションセンターは巨大で、約1,000人の参加者には大きすぎました。 ジョイントセッション、ブレークアウトセッション、朝食/昼食、展示エリアは、それぞれ建物が異なるフロアとエリアにありました。

Digital Book Worldは6つのトラックで構成されていました。 マーケティング、教育、法律、データ、制作、および新メディアを提供していました。 ケーススタディーセッションもありました。 注目された分野は音声技術(アレクサ、シリなど)、オーディオブック、デジタルブックでした。 出展者の大部分は、オーディオへの移行、書籍の販売、配布を手がけているサービスプロバイダーでした。

Score Publishingのビジネスは、オーディオブック、Kindle、インタラクティブなibooksと印刷の分野を中心に扱っています。 それが会議に反映されたのは驚くことでははありませんでした。 これらの分野に関心のある著者や出版社は、会議で生産性を見い出したでしょう。しかし、企業の自動化ソリューションに興味を持ち、書籍の背後にあるテクノロジーに関する議論を期待していた出席者としては、それは少し残念であると感じました。

アンテナハウス(海外サイト)
http://www.antennahouse.com/

http://rainbowpdf.com/




瞬簡PDF 作成 2024
ドラッグ&ドロップでPDF作成


瞬簡PDF 変換 2024
PDFをOffice文書へ高精度変換

海外出展情報 その1

アンテナハウスは最近、ドイツで開催のFrankfurt Bookfairとテネシー州ナッシュビルで開催のDigital Book Worldに出展しました。 これらのイベントに参加することの趣旨は、出版業界の方向性、出版社、ベンダー、消費者が興味を持って探しているものへの理解をより深めることです。

Frankfurter Book Fair(10月10-14日開催)は、500年以上の伝統を持ち、出版社の数と訪問者数の両方においても世界最大の書籍見本市です。世界中の出版社や訪問者が集う国際的なイベントです。 今年は109カ国から7503社の出展者と285,000人の来場者がありました。 5日間のフェアは、大規模な複数階建ての建物内にあるおびただしい数のパビリオンで開催されます。 アンテナハウスが関連しまた関心を持った分野は第4ビルに集中していました。第4ビルには、主に出版業界、学術出版の展示がありました。 ブックフェアにはアンテナハウスのパートナーがいつものように出展、ヨーロッパの長年のお客様とも会える大変貴重な機会でもありました。

アンテナハウス(海外サイト)
http://www.antennahouse.com/

http://rainbowpdf.com/




瞬簡PDF 編集 2024
かんたん操作でPDFを自由自在に編集


瞬簡PDF 作成 2024
ドラッグ&ドロップでPDF作成

アンテナハウス PDF活用レシピ ~PDF の美味しいクッキング教室~ 

PDFの活用方法を実際の利用例を参考にして セミナー を開催いたします。

セミナーでご紹介する製品は、以下の予定です。

PDF Tool API V6

「Antenna House PDF Tool API」(PDF Tool API)は、PDFファイルの情報取得やPDFファイルの加工・編集を行うライブラリです。

PDF Tool APIに関する詳しい情報は、PDF Tool APIページ を御覧ください。

PDF CookBookに関する詳しい情報は、PDF CookBookのご紹介 を御覧ください。

PDF Tool APIを組み込んだブラウザベースでPDFを編集するデモサイトをお公開しております。詳しくは、PDF Tool API デモ を御覧ください。

Office Server Document Converter

「Office Server Document Converterを」(OSDC)は、Microsoft Officeを使わずに、サーバー上でWord/Excel/PowerPoint/RTF/PDFを様々な形式にダイレクト変換するライブラリです。Windows環境のみならず、Linux環境でも高速に処理できます。

Office Server Document Converterに関する詳しい情報は、Office Server Document Converterページ を御覧ください。

AH Formatter

「AH Formatter」は、大容量・多言語データに最適な自動組版ソフトです。独自開発した PDF出力エンジンで、アクセシブルなタグ付きPDF や印刷用の PDF/X、長期保存用の PDF/A などさまざまな PDF形式の出力ができます。

AH Formatterに関する詳しい情報は、AH Formatterページ を御覧ください。

セミナー当日には、各製品担当者も会場入りしておりますので、別室で個別にご相談いただくことも可能です。
是非、ご参加ください。

〒103-0004
東京都中央区東日本橋2-1-6 東日本橋藤和ビル5F
アンテナハウス株式会社
◆ご購入に関するお問い合わせ(祝日を除く月~金曜日9:30~18:00)
TEL : 03-5829-9021
FAX : 03-5829-9023
E-mail: sis@antenna.co.jp
URL : https://www.antenna.co.jp/




瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識


瞬簡PDF 作成 2024
ドラッグ&ドロップでPDF作成

[AH Formatter V6.6] 新機能 justify-rowspan-height のご紹介

こんにちは
AH Formatter サポート担当です。

先月末に『AH Formatter V6.6』を公開いたしました。
今回は V6.6 で実装された新機能のうちのひとつを紹介いたします。

それが、オプション設定ファイルの justify-rowspan-height です。
ヘルプには機能説明として次のように書かれています。

 rowspanされたセルがあり、そのセルの高さが高いとき、
 そのセルが占める各行の高さをなるべく均等にするかどうかを指定します。
 高さが指定されている行やセルがあるとき、文字方向が回転しているセルがあるときは、
 その行より後ろだけが均等になるように処理されます。

実際のサンプルを見てもらうとこんな感じです。

justify-rowspan-height=false の例

セルや行の高さが固定でなく、rowspan された右側のセルの高さが左側のセル 1-1~3-1 の合計の高さより大きいとき、
左側のセル 1-1~3-1 の合計の高さは右側の rowspan されたセルの高さになります。
『AH Formatter V6.5』以前または justify-rowspan-height=”false” では 3-1 のセルだけ高くなります。

1-1~3-1 が共通している項目であれば、高さ、揃えたいなぁと思うでしょう。
しかし、右側のセルの内容量が流動的であれば固定値で高さを指定するのも難しい。
そのような場合に、
『AH Formatter V6.6』ではオプション設定ファイルで justify-rowspan-height=”true” と指定すると高さを揃えることができます。

justify-rowspan-height=true の例

注意点として、
この機能はオプション設定ファイルで指定するので、ドキュメント全体に影響するかもしれません。
個別にテーブル単位での指定はできません。
それから、”なるべく均等にする” ので、きっちり等分というわけにはいかないかもしれませんのでご了承ください。

AH Formatter V6 サンプルFO集」のページでも V6.6 の新機能を近日公開予定です。
※ 2018年9月25日 サンプルを掲載しました。「サンプルFO集 更新情報」をご覧ください。

 




瞬簡PDF 作成 2024
ドラッグ&ドロップでPDF作成


瞬簡PDF 変換 2024
PDFをOffice文書へ高精度変換

[AH Formatter V6.6] OpenType の MATHフィーチャに対応

2018年8月30日にリリースいたしました新バージョン『AH Formatter V6.6』から対応された MathML に関する機能についてご紹介いたします。MathML は W3C が定めた数式記述言語となります。詳しくお知りになりたい方は弊社より販売、公開中の「数式組版入門」を是非ともご覧ください。

本題に戻りますが『AH Formatter V6.6』では数式用の OpenType フォントに含まれる、MATHフィーチャに対応しました。MATHフィーチャには数式の配置、サイズ調整などレイアウトするための多くの情報が含まれています。次の画像は『AH Formatter』の V6.5 と V6.6 で MathML を描画した一例となります。

OpenType の MATHフィーチャの組版例

各数式を組版している数式フォントは V6.5 が STIX、V6.6 が STIX Two Math となります。
STIX Two Math は MATHフィーチャを含みますが、STIX は含みません。

V6.6 では MATHフィーチャの処理により分数式の割線と分子分母との間隔が文字毎に調整され、
積分記号などもフォントに含まれている MATHフィーチャの情報を元にしたグリフを採用します。

MATHフィーチャの機能はオプション設定ファイル enableOpenTypeMATH によって設定を変更できます。enableOpenTypeMATH に指定できる機能名キーワードはマニュアルにてご紹介しております。enableOpenTypeMATH の設定により MATHフィーチャの処理そのものを有効・無効することや特定の処理だけを有効・無効にすることも可能です。

MATHフィーチャ対応のほか『AH Formatter V6.6』の詳しい機能については、製品ページをご覧ください。
V6.6 の新しい機能

評価版をご用意しております。是非、お試しください。
AH Formatter 評価版のお申し込み

 




瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識


HTML on Word
WebページをWordで作る!

Antenna House Formatter V6.6 のご紹介

2018年8月30日に XML/HTML 自動組版ソフトのベストセラー『AH Formatter』をバージョンアップした『AH Formatter V6.6』を公開しました。

AH Formatter ロゴ

『AH Formatter』は XML で記述されたマニュアル、契約書、報告書・書籍などを XSL-FO または CSS によりレイアウトを指定して、PDF に出力したり印刷するソフトウェアです。

XSL-FO は W3C が XML に対するレイアウト指定の標準として勧告している世界標準です。国内外で『AH Formatter』は最も優れた XSL-FO 準拠製品との評価を確立しており、現在、自動車、携帯電話、航空機、OA機器のメーカ等のマニュアル制作システムなど数千社のお客様にお使いいただいています。

『AH Formatter』は Webページ用に普及している技術である CSS もご利用いただけます。CSS3 のページモデルにも対応しているため、高品質なページ組版が実現できます。

マニュアルのような複雑なレイアウトには XSL-FO を、比較的単純なレイアウトには直感的な CSS をお薦めしています。

詳しくは製品ページをご覧ください。

AH Formatter の組版フロー

 
続きを読む




HTML on Word
WebページをWordで作る!


アウトライナー
PDFを解析して しおり・目次を自動生成
Pages: Prev 1 2 3 4 5 6 7 8 9 10 ... 25 26 27 Next