OCRのよもやま話

先週はNHKテレビのニュースで電子出版EXPO(7/4~7/6)についての話題が何度も取り上げられていました。ニュースを見られた方も、また直接会場に足を運ばれた方もたくさんおられたことでしょう。
弊社でも電子書籍関連の製品とサービスを出展しておりましたが、ご覧になられたでしょうか?
7月の第16回国際電子出版EXPOに、電子書籍関連製品とサービスを出展します。

さて、近年はスマートフォン(スマホ)やタブレット端末が急速に普及し、電子書籍や関連する技術・サービスへの関心も再び高まっているようです。
デジタル化されたデータを扱うといったら、これまではパソコンが主な手段でしたが、大きさや起動に時間がかかるなどの制約があり、いつでもどこでも気軽に使えるというものではありませんでした。

これを劇的に解決したのが、スマホやタブレットなど携帯性に特化した、まさに手のひらの上にのる「コンピュータ」の登場でした。
ハードウェアの進化でパソコンに近い処理性能が与えられてサクサク動作するのもさりながら、何よりインターネットへの接続が簡単にできる(というか、接続を意識することもないほど当たり前につながっている)ことが普及の大きな推進力となっているように思います。
これにより、単に個人の趣味的な使用にとどまらず、ビジネスシーンにおいてもパソコンを駆逐する勢いでスマホやタブレットの活用範囲が広がり続けているのは、皆さんもご存じの通りかと思います。

デジタルなデータを気軽に持ち出し、閲覧できる環境が広く整ってきたことで、電子書籍と同じようにこれまでややもすれば滞りがちだった企業内におけるペーパーレス化(紙文書のデジタルデータ化とその活用)にも拍車がかかることが予想されます。

前振りが長くなってしまいましたが、今週は、やや強引ながら電子書籍など紙を代替するデジタル化技術に欠かせないOCR技術について、これまであまりパソコンに縁のなかった方や、OCRという言葉にあまり馴染みのない方を対象にお話してみたいと思います。


デスクトップ製品のサポート期間

デスクトップ製品のサポート窓口には様々なお問い合わせがありますが、その中に製品のサポート期間を知りたいというお問い合わせがあります。
製品の利用ガイドなどにも記載されておりますが、アンテナハウスのデスクトップ製品は、お客様が製品をご購入されてから1年間がサポート期間となっており、お電話、あるいはメールでのお問い合わせにお答えしております。
また、ご購入から1年以上を経過した製品でも、製品の販売終了から1年未満の製品については、なるべくご質問にお答えしております。
販売終了から1年以上経過した製品のお問い合わせにつきましては、場合によってはお断りするケースもございますが、お客様が製品を使うにあたり、少しでもお役に立てるようサポートを行っておりますので、製品をご購入頂いた後、お困りのことがあった際には是非サポートセンターをご利用ください。
なお、デスクトップ製品のサポートについての詳細は「デスクトップ製品のユーザーサポートについて」をご参照ください。


PDF Driver APIのマルチスレッド変換

こんにちは。
今日は、PDF Driver API V5.0 のマルチスレッド変換について、紹介します。
PDF Driver API V5.0はマルチスレッドでの変換に対応しています。
複数のファイルを同時に変換することにより全体の処理時間を大幅に短縮することが可能です。

青線はExcel文書250個とWord文書150個を、赤線は比較的シンプルなExcel文書500個をそれぞれ
1~20スレッドで変換した場合に要した時間を示したものです。
CPUコア数程度までははっきりと処理時間が短くなります。ハイパースレッディングの効果は薄いですが、それでもCPUスレッド数の2倍程度のスレッド数までは時間短縮に効果があります。
サーバー上で変換を行うシステムではマルチスレッド実行により複数のキューを持たせることができます。
バックグラウンドでバッチ処理をしながら同じシステム上に今すぐ変換したいユーザー用の独立したキューを用意して、バッチ処理の影響を受けることなくすぐ変換させることも可能です。
※マルチスレッド変換時はEXCEL.EXE、WINWORD.EXEが合計で最大スレッド数と同じ数だけ動作します。
通常のOffice文書編集時とは比較にならないほど必要なメモリが多くなるので64bit版のWindowsをおすすめします。
※一太郎、PowerPointはアプリケーションの都合上マルチスレッド変換でもそれぞれ1つずつの変換しかできません。


CAS-UBにメルマガインポート機能(アルファ版)を追加

これまで述べてきましたように、今、有料メルマガの世界にEPUBを採用する動きが広まっています。
そこでCAS-UBではメルマガをEPUBに変換するサービスを追加する予定です。
現在、クラウド上のサービスではCAS-UBのドラフトの画面のテキストインポート機能にメルマガをインポートする機能(アルファ版)を追加しています。インポートファイルの形式をクリックすると次の画面になります。

ここに4種類のメニューは、次の4つのメルマガに対応します。
・メルマガH:マグマグから配信されている「堀江貴文のブログでは言えない話」
・メルマガK:「夜間飛行」から配信されている小寺信良の「金曜ランチボックス」
・メルマガT:「夜間飛行」から配信されている『津田大介の「メディアの現場」』
・メルマガU:「夜間飛行」から配信されている「内田樹メールマガジン 大人の条件」
実はメルマガをEPUBに変換するサービスの大きな問題は、メルマガ一つ一つに、専用の変換メニューを用意しなければならないことです。プログラムそのものは難しくないのですが、一定のルールに従って書いてもらえないと綺麗な変換ができないのですね。で、ルールは各著者によって違いますので、個別対応が必要になります。
メルマガ用EPUB3スタイルシートは、現在、開発中です。とりあえずは、既存のスタイルシートを少し直して、「標準メルマガEPUB3(アルファ版)」を用意してありますので、関心をお持ちのかたはお試しになってみてください。
但し、現在、綺麗に変換できるメルマガとしては、上記の4種類(と同じ雛形で書いたメルマガ)だけで、それ以外は満足のいく変換にはなりません。
なお、上の4種類はいずれも既にEPUB形式で配信されていますが、CAS-UBのEPUB自動変換はそれらのものよりも多少は良いと思います。
新しいスタイルシートやビジネスモデルを含めて「国際電子出版EXPO」にてご案内の予定です。
また、7月11日夕方、秋葉原にて「ビジネスモデルとしての有料メルマガを考える」というテーマでセミナーを予定しています。
有料メルマガライターまたは制作者のためのEPUB作成セミナー


メルマガ配信の新しいステージとEPUBのインパクトを考える―(下)メルマガビジネスの将来

『堀江貴文のブログでは言えない話』の成功により、有料メルマガのブームが始まったのですが、それでは将来はどうなるのでしょうか。
日経ビジネス2012年6月25日号の「敗軍の将、兵を語る」は「ホリエモンの獄中手記」です。その記事の最後の方に次のような文章があります:

しかし、「有料メルマガ」というメディアは大きな可能性があるかもしれません。将来は、テレビや新聞、雑誌に置き換わっていくものだと期待し、発信を続けていきます。

・有料メルマガが堀江氏の予見通り大きなメディアに成長するのでしょうか?
・そのためには何が必要なのでしょうか?
このことについて多方面から勉強してみたいと考えて、有料メルマガライターまたは制作者を対象にして、「ビジネスモデルとしての有料メルマガを考える」セミナーを開催することにしました。本セミナーでは、メルマガ評論家の渡辺文重氏をゲストにお招きして、最近の有料メルマガの動きや未来についてお話をいただきます。
また、私は、EPUBがその一つの鍵になるのではないかと考えています。そして、アンテナハウスでは、メルマガを自動でEPUB3に変換するサービスを近く開始します。本セミナーではその狙いや内容についても紹介します。
●本セミナーの概要
テーマ有料メルマガライターまたは制作者のためのEPUB作成セミナー~ビジネスモデルとしての有料メルマガを考える~
○開催日時
2012年7月11日(水)18時30分~20時45分(受付開始18時00分)
○主な内容
・渡辺 文重氏講演「有料メルマガの未来」(45分)
・アンテナハウスのメルマガからEPUB3への変換サービスの趣旨とサービス内容説明(40分)
・質疑応答(15分)
○会場
東京・秋葉原UDXビル8F ネットカンファレンス会議室B
○定員
40名
○参加費用
一般5,250円(消費税込み)。但し、有料メルマガ・ライターまたは制作者は発行しているメルマガを示していただいた場合、無料となります。
○主催
アンテナハウス株式会社
○セミナー事務局
株式会社エクスイズム
○お申し込み
次のセミナー事務局の申し込みフォームでお申し込みください。セミナー事務局申し込み先(エクスイズムのWebページにジャンプします)
https://www.exism.co.jp/contact/form/seminarinq_sp.html


メルマガ配信の新しいステージとEPUBのインパクトを考える―(中)メルマガの配信形式

前回はメルマガ配信スタンドの動向、有料メルマガの増加、著者個人によるメルマガ配信の可能性、などについて考えてみました。
今回は、メルマガの配信形式として、EPUBが普及するかどうかを考えて見ます。
《注:本記事は、CAS-SUPPORTのブログ6月25日掲載分と同一の内容です》
やはり、最初に過去の歴史をさかのぼって見ます。まず、電子メールはこれまではテキスト形式が主流でHTMLメールが副次的に使われてきました。しかし、日本ではHTMLメールはあまり普及していません。米国などではHTMLメールがもっと普及していると耳にします。
「マグマグ」のベストセラーメールの配信形式をみてもHTMLメールは少ないことから、メルマガ配信形式としてのHTMLメールもあまり普及していないと言えるようです。
1. HTMLメールが普及しなかった理由
HTML形式にすることで、テキスト形式に比べて次のようなメリットがあります。
(1) 見出しなどにレイアウトをつけたり、背景をつけたり、フォントサイズ指定、フォントファミリー指定などのレイアウト指定が可能
(2) 画像をページの中に埋め込むことでいままでコンテンツの充実が図れる
(3) 表の表現ができる
こうしてみますと、表現力という点では、HTMLメールがよさそうに見えます。
しかし、HTMLメールには次のような問題点があります。
(1) HTMLメールに対応したメール閲読ソフトが必要。
(2) HTMLメールでは、スクリプトを埋め込むことができるのでこれを悪用したウイルスが可能になるという問題があり、最初の頃にかなりネガティブキャンペーンが行なわれた。
(3) テキストだけと比べて、表などのレイアウトを指定するには、プラスアルファの作業が必要になる。
(4) さらにレイアウトセンスが問われる。一人で執筆能力とレイアウト能力を兼ね備えた著者は少ない。
(5) 画像を含めることが可能になるので、それを生かすためには、テキスト能力に加えて写真やイラストなどの画像を準備することが必要になる。
有料メルマガの場合は、お客さまでもある読者に向かってウイルスを送信する著者はいないでしょうし、(1)、(2)はあまり問題にならないでしょう。
(3)~(5)からは、HTMLメールの可能性を生かすには、著者の方に文章を書くことに加えて、熱意・スキル、スキルが足りない場合にはそれを補う体制作りが必要になることがわかります。
2. EPUB版メルマガの登場
こちら(CAS-UBにメルマガインポート機能(アルファ版)を追加)に紹介しましたが、2011年10月に津田大介さんのメルマガをEPUBに無償変換するサービスが登場したことがTwitter上で話題になりました。
その後、『津田大介の「メディアの現場」』は既にEPUB版のテキストメールとの同時配信を開始しています。また、「夜間飛行」はテキストメールとEPUBメールの同時配信を行なっています。
さらに、インプレスはEPUB版のみのメルマガを配信開始しています。このようにEPUBがメルマガの形式として採用される動きが出ています。
3. EPUB版メルマガの将来を考える
今後、これらの動きはどこまで進むのでしょうか?次のシナリオのどちらになるのでしょうか?
・有料メルマガの間に爆発的に普及する
・HTMLメールと同じように、一部の著者の採用するところでとどまる
EPUB版メルマガは表現力という点ではHTMLメールと類似しています。つまりHTMLメールの長所を引き継ぐことになります。
さらに、HTMLメールに無い、EPUB版メルマガの特徴として第一にパッケージ化があります。パッケージ化によって出版物としての形態を整えることができ、電子書店の店頭に並べることが可能になります。このことは、メルマガをEPUBにすることで流通ルートを増やせる可能性がある、ということになります。
一方で、HTMLメールが普及しなかった理由の(1)~(5)は、HTMLメールとEPUBメルマガの相違である閲読環境について、メールソフトをEPUBリーダやスマホ・タブレット環境に置き換えて考えると、EPUB版メルマガにもそのままあてはまってしまうようです。
ですので、EPUBメルマガが普及するためには、次の要件が整う必要があるのでしょう。
・まず閲読環境の普及が前提
・次にEPUB版メルマガの制作体制を整えること
■■7月11日「有料メルマガライターまたは制作者のためのEPUB作成セミナー」を開催します。


メルマガ配信の新しいステージとEPUBのインパクトを考える―(上)メルマガ配信の変遷

現在は、週刊有料メルマガ『堀江貴文のブログでは言えない話』が発行数1万を超える成功を収めたのをきっかけとするメルマガブームの最中です。
ここでは有料メルマガ配信の未来を考えるために、これまでのメルマガ配信の歴史を少し見てみます。ざっと調べてみた範囲ですので、間違いが多いと思いますが、お気づきの点を指摘いただけると嬉しいです。
《注:本記事は、CAS-SUPPORTのブログ6月24日掲載分と同一の内容です》
1. 初期のメルマガ配信スタンド
昔からのメルマガ配信スタンドでは、「まぐまぐ」が有名です。1997年にスタートした老舗です。
http://www.mag2.com/
「マグマグ」より少し遅れてNiftyも1998年7月にメルマガ配信サービス(Macky!)を開始しました。こちらは、その後、いくつかの変遷を経て終了になっています。このほかに、1990年代終わりから2000年代初めには、メルマ、メルマガ天国、パブジン、カブライト、E-Magazineなどの多数のメルマガ配信サービスがあったようです。
例えば次の記事:電子メールマガジンの作り方:インターネットウオッチ
http://internet.watch.impress.co.jp/www/column/m_mag/
しかし、上に掲載したメルマガ配信スタンドは2012年現在ではすべて活動を停止しています。
こうした初期のメルマガ配信スタンドは、「まぐまぐ」を除いて運営のための収入を確保するビジネスモデルが確立できなかったのではないかと思います。
おそらく初期のメルマガ配信スタンドは広告モデルであったため、読者を多数確保しなければならず、大きなスタンドしか広告収入を確保できなかったのだろうと推測します。なぜ、「まぐまぐ」が生き残り、他は生き残ることができなかったのかはもう少し詳しく調べてみる必要があります。
2. 有料メルマガの登場
初期のメルマガ配信スタンドは、その殆どが無料メルマガの配信だったと見られます。「まぐまぐ」が有料メルマガの配信を始めたのは、2001年の秋となっています。
○まぐまぐ、有料メールマガジン配信「まぐまぐプレミアム」開始
http://internet.watch.impress.co.jp/www/article/2001/0731/magpre.htm
週刊有料メルマガ『堀江貴文のブログでは言えない話』はこの有料メルマガの延長上にあります。
3. 有料メルマガ専門配信スタンドの登場
「まぐまぐ」は、無料メルマガからスタートして有料メルマガもサービスするようになったのですが、2010年頃から、有料メルマガを主体とするメルマガ配信スタンドが登場しています。これは新しい動きと言えます。
各メルマガスタンドがブランド・イメージ確立のためか、著者をかなり厳選してメルマガ発行に取り組んでいるようです。このためメルマガ配信スタンド毎にみますと、タイトル数がまだ2桁の前半です。
こうした新しいスタンドは著者をセレクトするという点で「まぐまぐ」とは一線を画しています。プロに近い著者に限定することでコンテンツのレベルを確保し、読者が安心して購読できることになります。その一方で、有料メルマガを配信したい多くの著者にとっては敷居の高い存在となります。
こういったメルマガ配信スタンドが今後どうなるか、その行方には目を離せません。
●「夜間飛行」
http://yakan-hiko.com/
ひよこファイターmusic合同会社
2008年設立
17人の著者の有料メルマガを配信
●「タグマ!」
http://www.targma.jp/
株式会社メディア・ヴァーグ
2011年4月設立
●「BLOGOSメルマガ」
http://magazine.livedoor.com/
ライブドアの有料メルマガサービス
24誌を配信
●「ビジスパ」
http://biz-spice.jp/public/
株式会社ビジスパ
●「フーミー」
http://foomii.com/magazines/
株式会社foomii
2010年6月~
42タイトル
●「イズメディアモール」
https://mall.ismedia.jp/?gclid=CMmt4-e227ACFUdKpgodcg2R0Q
2011/12/16 :イズメディア・モール オープン
イズメディア・モールにメルマガのセレクトショップがオープンしました。
4. 出版社によるメルマガ配信への動き
もうひとつ眼を離すことができないのは、大手の出版社によるメルマガ配信開始の動きです。
4.1 サイゾウ
サイゾウメールマガジン
http://www.cyzo.com/2011/06/post_7638.html
PC、携帯、スマートフォン向け/HTML形式
4.2 インプレス
MAGon
http://magon.impress.co.jp/
メール添付でEPUBを配信
2012年3月1日
4.3 講談社
講談社から初の有料メルマガ!第一弾は古賀茂明氏 
『現代ビジネス』( http://gendai.ismedia.jp /編集長・瀬尾傑)は、2012年1月12日、有料メールマガジンの発行を始めました。講談社が有料メールマガジンを発行するのは初めてです。
4.4 文芸春秋
Number 有料メルマガ
http://number.bunshun.jp/list/vianumber
2011年3月開始
4タイトル
5. 著者自身の有料メルマガ配信
著者自身がメールマガジンを配信する方法の基本は、(1) スタンドアロンの専用メール配信ソフトを使って配信する方法です。これは通常のメールクライアントの延長になります。(2) さらに著者がメール専用サーバを立ててメールを配信する方法があります。(1)、(2)は専用のシステムですが、別の方法として、(3)共有インターネットのメール配信サービス(メルマガ配信Webサービス)があります。
配信サービスの方はWebサービス化によって、利用への敷居は今後さらに下がると見込まれます。
もう一つ、メルマガ配信スタンドの利用と著者自身の配信するときの相違点は、決済サービスがあります。決済サービスについては、個人の著者が顧客のクレジットカード情報を取得するのは敷居が高いのですが、現在は、PayPalのような仕組みで小額決済を簡単にできるようになってきています。
この方式による有料メルマガ発行がどの程度行なわれているかは簡単には調べることはできません。発行者が点在し、メルマガの読者に対してワン・ツー・ワン(ピンポイント)で配信する活動が、社会全体でどの程度の行なわれているかを補足するにはしっかりと設計した統計的な調査が必要となります。
しかし、配信と決済の敷居が下がっていることを考慮すると、著者自身によるメルマガ配信が増えているのではないかと推測できます。
6. まとめ
メルマガは日本独自のサービスといわれていますが、1990年代後半に最初のメルマガ配信スタンドである「まぐまぐ」が登場して15年を経過しました。当初は無料メルマガ中心でした。
しかし、堀江貴文氏が有料メルマガで成功を見せたことによって、メルマガ配信サービス業界が全体として新しいステージに入っている、と言えます。
この有料メルマガ配信の新ステージにおいてEPUBがどのような役割を果たすのでしょうか。これについては、また後日検討してみたいと思います。
■7月11日「有料メルマガライターまたは制作者のためのEPUB作成セミナー」を開催します。


EPUB3.0とAH Formatter(後編)

今回は、既存のEPUBファイルの内容に、組版体裁を自由にカスタマイズしたCSS(AH FormatterのCSS3拡張機能も利用できる)とをあわせてAH Formatterで組版してPDFを作成する方法を説明します。
題材とするEPUBファイルは、前回に引き続き、IDPFでEPUB3サンプルとして公開されている『草枕』のEPUBファイルを使います。まず、このEPUBの中身をZIP解凍してXHTMLファイルとCSSファイルを見つけます。

カスタマイズCSSの指定

草枕EPUBの中には、縦書き用のスタイルシート vertical.css が入っています。この内容のルート(html)要素のスタイル指定は次のようになっています:

html
{
-epub-writing-mode: vertical-rl;
font-family: 'foobar', "HiraMinProN-W3", "@MS 明朝", serif, sans-serif;
font-size: 14pt;
margin: auto 1em;
padding: 1em 0;
max-height: 28em;
background-color: #fff4e7;
}

AH Formatterでは、CSS3 Paged Mediaを拡張したページの指定により基本版面の設定ができるので、ルート要素にあるmarginやpaddingの指定、1行の文字数を制限するためのmax-heightの指定は、不要です。本文のfont-sizeも変更したいです。それから、柱とノンブルをつけたいです。
ここでは、このCSSには直接手を加えないで、別のカスタマイズ用のCSSファイル ahcustom.css を作ってみました。これをAH Formatterに文書XHTMLファイルと一緒に指定すると、ahcustom.cssがユーザースタイルシートとして、文書に指定されているCSS(「著者スタイルシート」と言う)とともに組版に使われます。
以下、カスタマイズ用のCSSファイル ahcustom.css で何をしてるか、説明します。

ルート要素のスタイル設定

html {
font-size: 12pt !important;
line-height: 1.75 !important;
margin: 0 !important;
padding: 0 !important;
max-height: none !important;
}

font-sizeを変更し、margin、padding、max-heightの元のCSSでの指定をキャンセルしてます。!important の指定をすることで、著者スタイルシート(vertical.css)での指定をユーザースタイルシート(ahcustom.css)の指定で上書きすることができます(!important指定がないと著者スタイルシートのほうが優先度が高い)。

基本版面設定

ページサイズやマージンの指定は @page ルールを使います。

@page {
size: A5;
margin: auto;
height: 36rem;
width: 15rlh;
background-color: #fff4e7;
}

ページサイズをA5にしました。marginをautoにして、1行の文字数(height: 36rem)と1ページの行数(width: 15rlh)を指定しています。これはAH FormatterでCSS3を拡張した機能です。36remのremは、CSS3での単位でルート要素のfont-size、15rlhのrlhはAH Formatterの拡張単位で、ルート要素のline-heightから計算される行送り量です。

柱とノンブル設定

@page :right {
@top-right {
-ah-writing-mode: horizontal-tb;
font-size: 9pt;
content: "";
}
@bottom-right {
-ah-writing-mode: horizontal-tb;
font-size: 9pt;
content: counter(page);
}
}
@page :left {
@top-left {
-ah-writing-mode: horizontal-tb;
font-size: 9pt;
content: string(title);
}
@bottom-left {
-ah-writing-mode: horizontal-tb;
font-size: 9pt;
content: counter(page);
}
}
title {
-ah-string-set: title content();
}

これは、右ページと左ページそれぞれに柱とノンブルを指定しています。
@top-right、@bottom-right、@top-left、@bottom-leftなどはCSS3 Paged Mediaのマージンボックス(ページヘッダー、ページフッター)の指定です。
本文は縦書きですが、ページヘッダー、ページフッター内は横書きとするために、-ah-writing-mode(-epub-writing-mode でも同じ)で横書きの指定をしています。
content: “…”; は柱の文字列を指定します。content: “草枕”;のように、直接タイトルを書くこともできますが、通常は、XHTML内のtitle要素やh1要素で文字列を設定します(-ah-string-set: title content();)。content: counter(page) でページ番号を出力します。
以上が今回のカスタマイズCSSのだいたいの説明です(実際はもう少し調整のための指定を加えてます)。これを使って組版した結果が右のイメージです。
今回はごく基本的なスタイル指定しかしていませんが、このようなカスタマイズの方法を使って、既存のEPUBファイルの中身に、ユーザーの好みのスタイルを指定して、PDFにするということができます。ぜひ試してみてください。


EPUB3.0とAH Formatter(前編)

電子書籍の世界標準フォーマットEPUB3.0で、縦書き、ルビ、圏点など、日本語組版に欠かせない機能が搭載されました。アンテナハウスは、2010年よりこの仕様策定に協力してきています。
どうしてアンテナハウスがEPUB仕様に取り組んだかは、私たちがAH Formatterという組版エンジン(XML組版の世界標準であるXSL-FO仕様とともに、(X)HTML+CSS3拡張仕様によるページ自動組版に対応)を開発してきたことと、EPUBフォーマットの内容にはXHTML+CSSが使われていること、EPUBの日本語組版要求仕様の元になったW3C技術ノート「日本語組版処理の要件」(JLREQ)の編纂作業に私たちが深く関わっていることから、理解していただけるかと思います。
この成果を利用して、アンテナハウスのクラウド型汎用書籍編集・制作サービス「CAS-UB」では、EPUB版と、PDF版(AH Formatterによる高品質な組版)の電子書籍を同時に制作することができています。

AH Formatterで組版された『日本語組版処理の要件』書籍版、そしてEPUB版

『W3C技術ノート 日本語組版処理の要件』書籍版は、AH Formatter V6のCSS組版によって制作されました。詳しくは:

また、アンテナハウスでは『日本語組版処理の要件』EPUB版も制作しています。CAS-UBブログの次の記事をご覧ください:

EPUB文書をAH Formatterで組版~EPUB3.0のCSS3拡張への対応

CAS-UBサービスではEPUB(2.0と3.0)とPDFの両方が生成できます。では、手持ちのEPUBファイルをAH Formatterで組版することもできるでしょうか?
いまのところアンテナハウスはそれについて何も言っていないのですが、EPUBの内容はAH Formatterが対応しているXHTML+CSSですので、それをAH Formatterで組版することは可能です。方法は、まず、EPUBファイルの内容を展開することです。EPUBはZIP圧縮ファイルですので、ZIP解凍ツールで中身のファイルを展開することができます。
たとえば、IDPFでEPUB3サンプルとして公開されている『草枕』のEPUBファイルをダウンロードして、ZIP解凍すると、/OPS/xhtml/ フォルダに *.xhtml ファイルがあります。これらを AH Formatter に指定して組版することができます。
(AH FormatterでEPUB内容を組版)この図は、AH Formatterで、「草枕」のXHTMLファイルを指定して組版結果を表示した例です。こんなふうに、EPUBに入っているXHTMLとCSSをそのまま使ってもAH Formatterで組版して表示したりPDFに出力することができます。
AH Formatter V6.0は、EPUB3.0のCSS3拡張プロパティ(縦書き指定などCSS3ドラフト仕様を -epub-プレフィクス付きで採用しているもの)をサポートしています。縦書き/横書きの指定(-epub-writing-mode: vertical-rl)、圏点(-epub-text-emphasis-style等)、段組(-epub-column-count等)、縦中横(-epub-text-combine)などです。これにより、この「草枕」の例のようにEPUB3.0のXHTMLに縦書き用のCSSが指定されていれば、そのまま縦書きで組版されます。
今日は、ここまでとして、後編ではさらにこれを応用して、既存のEPUBファイルの内容に、組版体裁を自由にカスタマイズしたCSS(AH FormatterのCSS3拡張機能も利用できる)とをあわせてAH Formatterで組版してPDFを作成する方法を説明したいと思います。


Pages: Prev 1 2 3 ... 156 157 158 159 160 161 162 ... 224 225 226 Next