カテゴリー別アーカイブ: EPUB

Amazon Kindle形式の電子書籍出版方法

欧米の電子書籍ではePubと並んでAmazanのKindleで形式も重要な存在である。しかしKindle形式については公開された資料があまりないようだ。そこで、「The Complete Guide to Formatting Books for the Amazon Kindle」(eBookArchtects.com発行、Joshua Tallent著)を読んでみた。同書から以下にポイントを簡単に紹介してみる。
 
Kindleで本を出版するには次の方法がある。
1.Kindle形式は実質的にMobipocket形式なのでMobipocket形式を作ってKindle DTP (Digital Text Platform)にアップロードする。
2.DTPにWord文書ファイルやHTMLファイルをアップロードし、DTPがそれらのファイルからMobipocket形式を自動的に作成する。
Mobipocket形式にしてからDTPにアップロードするメリットは次の3点である。
(1)toc.ncx というファイルを加えて、ナビゲーション機能を使えるようにすることができる(Kindle2から有効)
(2)eBookBaseというMobipocketの電子書籍配信チャネルを使うことができる。
(3)DTPにHTMLをアップロードするとDRMフリーになる。それに対して、Mobipocket形式ではDRM(デジタル著作権管理)を設定できる。
Mobipocket形式のファイルはcalibreやMobipocketCreatorを利用してHTMLから作成する。MobipocketCreatorでは内蔵の変換機能を利用して、テキストファイル、Word文書ファイル、PDFファイルをインポートすることもできる。
MobipocketCreatorでは、OPF (OpenPackaging Format)を作成する。OPFの形式はePubと同じである。OPFの中に,Metadata, Manifest, Spine, Toc (toc.ncxファイルの参照) などの情報を保存する。
 
OPFの情報を準備した後、書籍をビルドする。この処理をMobigenというコマンドライン・プログラムで行うこともできる。OPFやtoc,ncxをプログラムで作れば、すべての処理をオン・ザ・フライで行うことも可能である。


電子書籍関係の用語についてのメモ

○電子媒体と印刷媒体の関係
印刷媒体である書籍、雑誌、新聞は情報の内容、印刷・流通技術、ビジネスモデル、マーケティング方法がかなり違います。書籍、雑誌、新聞の紙のモデルをそのまま電子機器の上に継承して実現することできるかは未知数です。でも当面は、電子書籍、電子雑誌、電子新聞は、紙のモデルを継承したものとして定義しておきます。将来はいづれそれぞれ紙媒体とは異なる姿になっていくのかもしれません。
 
○書籍(紙)
書籍とは思想・情報に関する言語表現をある方針で編集した、ある厚さ(表紙を除き、49頁以上)をもつ不定期刊行の冊子のことを言います。
 
○電子書籍
電子機器で閲読される利用方法を想定してパッケージされ配布される書籍のデータ。このような定義では、例えば、印刷を目的として発注元から印刷会社へ受け渡されるPDFは電子書籍には分類されません。電子書籍というとき、電子雑誌や電子新聞を含んでいることもありますので注意が必要です。
○ePub
ePubは電子書籍の情報パッケージ形式の一種で、電子機器の上のePubリーダで閲読します。
ファイル形式の仕様はInternational Digital Publishing Forum (IDPF) が策定しています。
 
○Webページと電子書籍の関係
Webページは、インターネットに接続された状態の電子機器の上で、主にブラウザを使って閲読するもの。ブラウザはページの概念を持っておらず、ブラウザの表示は長い巻物の一部を画面をずらしながら見ていくやり方です。
電子書籍はパッケージされた状態で配布されており、オフラインで見ることができる点で、Webページとは異なります。電子書籍の閲読は画面を1ページとして割り当ててページを捲るように見ていく方式が主流です。
 
○組版
組版は文章や図・表などを配置して印刷のための版を作成することです。組版においては版の大きさ、特に版面設計が非常に重要なポイントとなります。紙のサイズには一定の規格があり、本の大きさ(判型)の種類は限られています。また一つの書籍では判型は固定です。
○電子書籍と組版
電子書籍に関する最近組版という言葉を議論でも見かけます。しかし、電子書籍では、電子機器のディスプレイのサイズや解像度はばらばらです。電子書籍のリーダは画面のサイズに合わせて、文章を最適表示します。読者が文字の大きさを指定することとも可能です。このように画面に可視化する処理と判型を固定した上で、文字や画像を配置する印刷組版とを同一に組版と言う言葉で表すのは違和感があります。電子書籍の表示はレンダリングという言葉を使うことを提案します。
○印刷
印刷は文字通り紙に出力することを示します。書籍は、通常、印刷会社で印刷しますが、今後は、書籍をPOD(プリント・オン・デマンド)で印刷することも増えていくと思います。


新しい本作りのワークフロー XHTMLを交換形式に使う

少し前になりますが、境祐司さんのPodcastで交換形式の重要性を語っていて、その記事を次回の「読むウェブ ~本とインタラクション/gihyo.jp」に書くと言っていました。きっと第16回になると思い、心待ちにしていたのですが、第15回が7月15日で、もう1ヶ月過ぎたのになかなか発表されません。
 
これはあまりに革新的すぎて、編集部でリジェクトされたのではないかなどと妄想していますので、記事が出る前に勝手ながら、ちょっと解説してみます。境さんの方法は、動機と目的は違いますが、方法としてはオーム社開発局のIdeo Typeとかなり似ている方法です。
 
(1) Ideo Type方式は著者にXHTMLで原稿を書いてもらい、これをTeXに変換してTeXで書籍を制作する方法です。
 
(2) 境方式ではXHTMLを元にしてInDesignを使って書籍を制作する。書籍を制作したときの最終版までの修正箇所をまとめて、オリジナルのXHTMLに反映する。XHTMLを元にしてePubを作るという方法を取っているようです。
 
両方とも著者が書籍のコンテンツをXHTMLで作成するというところが共通です。この場合、問題はXHTMLの標準のままでは書籍に必要な次のような要素が表現できないということです。
・索引項目
・脚注(記号、テキスト)
など
 
Ideo Typeではclass属性値を規定して解決しているようですが、境方式ではどうしているのか?このあたりが気になっています。いづれにしても書籍のコンテンツをXHTML(拡張を含め)で表現するというのが、XHTMLエディタによる編集、Webとの親和性からしても一つの方法です。
 
境方式は、ワークフローの成果物としてePubなどの電子書籍を重視していますが、IdeoTypeは開発時点では電子書籍は配慮してないと思います。Ideo Typeを電子書籍向けに拡張していくのは簡単なはずです。
 
また、将来はXHTML文法からHTML5文法に変わるのかもしれません。いずれにしても、紙と電子を統合する新しい書籍制作フローの萌芽と思います。
Podcast: 境祐司さん


DITA からePubを自動作成するオープンソース・プロジェクト

だんだんと電子書籍形式の主流になりそうなePub形式。iBooksのePubリーダは、7月下旬の1.1.0でエンハンストePub機能(音声、マルチメディアの埋め込み)がサポートされるなど、速いスピードで進化しています。現在は日本語テキストの表示機能はいまいちですが、iBookstoreで日本版電子書籍の取り扱いが正式に始まる頃には、多分、日本語テキスト表示も改善されるに違いありません。
 
ePub作りは、まだ、DTPで元ネタを作ってからというワークフローが注目されています。例えば、最近の「MdN」(2010年9月号)。しかし、これは非生産的。
 
XMLからePubを自動的に作り出すのは簡単ですし、本来、こちらが主流となるべきと考えます。
 
そういう意味でDITAのOpenToolKitのプラグインとして開発が進んでいる「DITA For Publishers」に注目。8月14日にV0.9.1が公開されました。
 
○「DITA For Publishers version 0.9.1」
http://sourceforge.net/projects/dita4publishers/


デジパブフェア出展 ePub on iPad が大人気

本日で、第14回デジタルパブリッシングフェアが終了です。
 
ご来場いただいた皆様ありがとうございました。また、関係者にお礼を申し上げます。
 
今回は、直前に発表になった、平成22年情報通信白書のePub版をiPadでデモしていたのですが、これが大人気となって、狭いブースの入り口が一杯になってしまい、ブースの中で展示していた製品のデモに至らなかったようです。
 
直前にデモ版(β版)が完成した「アウトライナー2 速ワザ」はチラシがかなり人気でしたが、どの程度、実際にご覧いただけたでしょうか?
 
「アウトライナー2 速ワザ」のWebページ
○ブースの様子
DSCF0144.JPG


デジパブフェアでデモしている「通信白書」ePub版 on iPadに人気

Twitterを見ていましたら、現在、デジタルパブリッシングフェアの会場でデモしている日本初の電子書籍版白書である平成22年版「通信白書」のePub版 on iPadに人気が集まっています。
  
1昨日のテレビニュースでは、iPadの画像だけしか紹介されず「何で通信白書がiPad版になったといいながら、iPadの製品紹介とは??」と思いましたけど。いよいよ解禁です。
今、一般の方が、実際にご覧いただけるのは、デジパブフェアの会場のみですよ!
 
以下、Twitterより、
@lost_and_found: アンテナハウスさんのブースで情報通信白書のEPUB版 on iPadが見れるとのこと。
@ytaniwaki: 白書で初めて電子書籍化しました。
@iwafuchi: アンテナハウスさんのブースで見た情報通信白書のEPUB版 on iPad 意外に美しくてびっくり。 
–ここまで
 
TBSの7月6日ニュース、「通信白書のiPad対応版が7月中旬にリリースされる」ことが報道されております。
http://news.tbs.co.jp/20100706/newseye/tbs_newseye4470697.html
総務省のニュース
http://www.soumu.go.jp/menu_news/s-news/02tsushin02_02000025.html


デジタルパブリッシングフェアの出展ご紹介

本日から始まるデジパブフェアですが、弊社はいつものようにデジタルコミュニケーションズ、エクスイズムと関連3社で共同出展です。
■ 主なブース出展内容
(1)アンテナハウス
・PDFの仕上げソフト「アウトライナー」にFlash形式eBookの作成機能「速ワザ」を同梱
 出力サンプル(暫定) → http://www.antenna.co.jp/haya/sample/dev-sample/index.html
・AH Formatter:Webと印刷の統合するXML/HTML組版ソフト
  → http://www.antenna.co.jp/AHF/
・AH PDFServer:社内文書をPDF化し管理する
  → http://www.antenna.co.jp/psv/
(デジコミ)
・Word2ePub:Word2XMLの応用技術により、WordからePubを直接生成します。
  → http://www.sgml-xml.jp/tools/Word2ePub.html
・WordToXMLコンバータ:既存Word(テキスト文書)であれば何でもXMLに変換
  → http://www.sgml-xml.jp/tools/WordtoXMLconverter.html
・PPT 2 XML:PPT作成したコンテンツが、カーナビの情報コンテンツに反映
  → http://www.sgml-xml.jp/tools/PPT2XML.html
(エクスイズム)
・自動組版機能を持つ文書管理CMS
  → http://demo.exism.co.jp/eXDoCS/index.html
■ インフォプリント・ソリューションズ・ジャパン ブースでAH Formatterを紹介します。
インフォプリント・ソリューション社のフルカラー・システム・プリンターInfoPrint 5000と製本ソリューションにより、小部数印刷、マニュアル、個人出版書などのビジネスに活用できるデジタル印刷機をご紹介。広範囲なデジタル情報の可視化アーキテクチュアであるAFP(Advanced Function
Presentation)にAH Formatterが対応。製品のご紹介を行います。
→ 
http://www.infoprint.com/internet/wwsites.nsf/vwwebpublished/mainT1_jp
■開催場所
* 東京ビッグサイト 西ホール
   ブース番号:6-70


書籍をXMLで制作する動きは一般化するか?

つい先日まで、書籍は特別なものを除き、XMLで作るのは効率が悪いと思っていました。しかし、どうやらその考えを改めるべき時期が来ていると感じています。
 
電子書籍の時代が近づいているのですが、そうなると一つの書籍コンテンツを印刷と電子書籍の少なくとも2つのメディア向けに利用できるようになります。さらに、電子書籍はリーダデバイス向けに何種類か用意する必要もありますので、コンテンツをXMLで制作して多様なメディアに出す仕組への投資が意味をもつようになると思われます。
米国では、コンピュータ関係の専門書を出版しているO’Reillyは電子書籍に熱心です。すでに様々な形式への対応を済ませており、電子書籍を一回買えば一生読めると書いています。DRMフリーでPDF, ePub, Kindle, Android 用の各種形式をそろえていて、どの形式でもDLできると。
http://oreilly.com/ebooks/
 
書籍をXMLで作るのは難しいと思っていたのは、主に次のような理由からです。 
 
1.書籍はドキュメントとしては、一品生産であり、多品種少量生産の最たるものであること。
2.それに対して、XMLで作ろうとするとシステムの初期投資も必要である。
3.XMLのエディタは高価なものが多いし、XMLエディタの使い方を覚えなければならず、オーサリングの生産性が低下する可能性が大きい。
4.XMLで文書を作るには、要素や属性の意味や使い方を理解しなければならず、書籍の著者にそういう学習を求めるのは難しいだろう。
5.世間には、XMLのタグを見ただけで、恐れをなしてしまうような人が多く、そういう人を相手に教育するだけでも大変だろう。
 
このように考えるとXMLを書籍分野に応用するのは労多くして、その割りに益が少ないのだろうということになってしまいます。
 
但し、一部の出版社は書籍をXMLで作ることに力を入れています。その最右翼はO’Reillyです。同社は書籍をXMLで制作しているものが多いようです。以前調べたところでは多くはFrameMakerで制作されてました。 どの程度の割合かは分かりませんが、一部の書籍は当社のXSL FormatterでPDF化しているものもあります。同社の本をダウンロードして、PDFのプロパティを見ると分かります。 
 
技術文書で一般的な文書型であるDocBookもO’Reillyが提唱したもののようです。大変な先見の明と思います。
日本でも一部の出版社が熱心に取り組んでいます。
 
書籍をXMLで制作することで、出版社の制作期間とコストは大幅に下げることが可能となります。これは弊社が関与した次のような例でみても明白です。
1.「Open Office XML Formats入門」(2007年9月25日, 毎日コミュニケーションズ)
ケーススタディ報告:XSL-FO による書籍の自動組版 http://bit.ly/bC4sCa
2.「Introduction to DITA(ジョアン・ハッコス著)」をDCJが翻訳した「DITA概説書」
ソースはDITA(XML)形式となっています。これをXSL-FOとしてAH FormatterでPDFを作成。PDFを出版社に渡して書籍にしています。 DITA Festa 2010でケーススタディが報告されています。
「DITA概説書」
 
これらの例で見ますと、書籍の制作期間の大幅短縮・出版社にとっては大幅な制作費のダウンとなっています。
 
但し、これらの例は、いずれも著者がXMLの専門家であって、XMLのコンテンツ編集は障害になっていません。また普通は1品ものだとXSLスタイルシートの開発コストが高くついてしまうのですが、上のケースでXSLスタイルシートは、実は両方とも弊社の技術スタッフが作りましたので、スタイルシード開発費は見えていません。
 
Twitterでは、その対策として「XMLのひと要素にXSLTのひとテンプレート/ファイルを対応させています。また、FOの属性値もハードコードではなく、パラメータ渡しできるようにしています。パラメータ渡しを徹底すると、汎用性が増す上にFANTaStIKK のようにGUIをかぶせてやることもできますね。増えすぎるとコード書く人間が混乱してきますが。」(@henowaさん)というツイートもありましたが、XSLスタイルシート開発コストを下げる工夫も鍵となります。
 
また、マニュアルなどと商品としての書籍ではレイアウトについても変わって来ますので、商業レイアウトのできるスタイルシート開発者の確保も必要になると思います。
 
このようにいろいろな課題がありますが、いよいよ、1品ものの書籍もXML制作の時代がきたということを強く感じます。今後は、この点への取り組みを強化していきたいと考えています。


ePub 2.1 への課題と方向性(IDPF)

ePub 2.1 WGの課題
○現在の課題
1.Videoなどのリッチメディア、対話性のサポートが必要
2.グローバル言語の高度なサポート。CJKに特に関心あり。
3.高度な記事のサポート。雑誌業界のPRISM標準をePub配信するワークフロー
4.高度なメタデータの必要性
5.ページレベルのレイアウト伝達と1刊行物で多種類の表示サイズの必要性
6.高度なナビゲーション・サポートの必要性
7.広く使われているWeb標準との整合不十分。モダンブラウザとの整合性を改善
8.注釈のサポート、読んでいる位置、しおり、注釈を蓄積・交換する標準
9.数式をサポートしていない
10.書物特有の意味のサポートがない。用語集、覚え書きの参照、先進的相互参照システム
11.アクセシビリティ・サポート
12.業界特有の拡張を追加する機構
13.承認済みの国家的、国際的規格との明確な関係
14.広告を含める機構
ePubの課題追跡データベース
○予備的な解
1.HTML5の採用
2.ページ単位のレイアウトと複数の表示領域サイズは出版社、ベンダ、エンドユーザの競合調整
3.拡張機構の改善
 
○WGの期間
1.2011年5月まで
・2010年9月までに最初の草稿
・2010年12月までにパブリック草稿
・2011年1月までに標準草稿
・2011年5月までに最終勧告
2.WGの成果物はIDPF会員向けWebサイトで入手可能


電子書籍のデータをどうやって保存するか?

Twitterを見ていましたら、昨日、電子書籍のデータを保存するのにどういう形式が良いか、というやり取りがありました。ハッシュタグは #denshi #ebookij。
「電子書籍にするために保持するフォーマットは(書籍原稿なら)テキスト形式。画像付きならDTPファイル」(@tashiro_m)
 
というような発言から少しやりとりがありましたが、@tashiro_mさんの発言は、主に、再編集したり、再利用することを想定しているように想像します。
 
一般に、こういう課題を考えるとき、編集用の形式(生データといっても良い)と配布用の形式を分けて考えると良いように思います。
例えば、Wordの文書は編集用の形式ですがPDFは配布用の形式となります。編集用の形式は編集しやすいものでなければならないのは当然ですが、配布用の形式は編集できては望ましくないこともあります。配布形式から編集形式には簡単には変換できないのが普通です。
 
現在、注目を浴びているePubは配布用の形式です。
また、例えばDITA(Darwin Information Typing Architecture)のTopicは編集用の形式です。配布用の形式としてHTML、PDFなどを使います。DITAをePubに変換するオープンソース・プロジェクトもあります。
 
例えば数式を編集したり配布したりするときはどうでしょうか。編集形式は現在はTeXが良いように思います。未来まで考えると、「Unicode Nearly Plain-Text Encoding of Mathematics」(Unicode Technical Note #28)が普及すると良いかなと思います。
数式の配布形式は、Web向けに配布するならラスター画像に変換します。紙とその等価な媒体向けならPDF形式。MathMLをレンダリングできるリーダがあるなら、MathMLで出すのが良いと思います。
  
電子書籍を想定するとき、編集用の形式は何が良いかはかなり難しい問題です。あるいは、これは個別の利用用途によって異なりますので、一般解はないかもしれません。
 
そして、著者が保存するのは編集形式またはその等価な形式とするべきです。そうしないと再活用できないからです。
 
また、データを少ないコストで利用できるためには編集形式から配布形式へは自動変換できることが必要です。
 
こうしたことを考えるとDTPは編集形式として保存するのは不適切ではないでしょうか。なぜなら、コンテンツとレイアウトが渾然一体となっており再利用しにくいですし、DTPからePubなどのレイアウトを(CSSで)別指定する配布形式への変換にはコストが掛かる場合があります。テキストをePubに出すときはレイアウトのために新たにマークアップする必要がありますので、やはり工数がかかるので不適切です。
 
独自のXMLでも良いですが、XHMLや場合によってはDITAが編集・保存形式として適切かもしれません。 
 
○参考資料
Unicode Nearly Plain-Text Encoding of Mathematics
Office2007の新しい数式エディタ
DITA


Pages: Prev 1 2 3 4 5 6 7 8 9 10 11 Next