カテゴリー別アーカイブ: コラム

EPUBをPDFに変換するのは結構厄介。PDFのためのEPUB作りの注意事項

おはようございます。

本日と明日は、電子出版サービスグループから話題をご提供いたします。

今日のお題は、「EPUBをPDFに変換するときの注意事項」です。

アンテナハウスの電子出版サービスグループは、EPUBをPDFに変換するサービスとして、「EPUBtoPDF変換サービス」を展開しています。

書店(ストア)から購入したDRMのかかったEPUBには対応しておりませんが、出版社や著者さんが持つEPUBがあれば、ご希望のページサイズ、フォントサイズ、ページのマージンなどでPDFに変換しますよ、という内容です(1冊/3000円+税)。

さて、EPUBからのPDF変換は、EPUBの持つCSSでの体裁を生かした上で、ページ情報など「印刷組版」(=ここではPDF組版のこと)に必要な情報を追加して行なっています(バックグラウンドで動いているのは、当社の主力製品より、 AH CSS Formatterです)。EPUBの内容を自動組版でPDF化するので、EPUB中に指定されている内容をそのままPDFにします。逆に言えばEPUBに対する編集は一切行いません。変換のお値段からも推測いただける通り、人手による調整は原則として一切行いません。

このサービスでは、EPUB用に作られたデザインを用いてPDF用に組版するため、そのEPUBのタグの付け方やデザインの仕方によっては、大層見栄えの悪いPDFになってしまうことになります。結果として、こんなはずではなかったという期待に沿わないPDFができあがってしまいます。

一番多く、且つ非常に困るのは、EPUBの中で改行”<br>”や空行”<p></p>”を多用して段落間の空きを作ったり、箇条書きなどで、全角空白文字でインデントを作るパターン、次点で”pagebreak”(改ページ)をやたらに使うパターン、またはその複合型です。

KindleやEPUBには紙のページに相当する固定サイズのページはありません。そこで上述のように空きを設定しても問題ないかもしれないですが、PDFに組版する際、EPUBのデザインを使って固定サイズのページ上にレイアウトしていくため、こうした<br>や<p></p>、全角空白文字、pagebreakは、「ページ」という決められたサイズに配置する時には悪手になることが多く、無駄に白紙ページを量産したり、箇条書きの場合は、折り返した2行目の文字の並びが最初の行より飛び出しすぎていたり、後ろに行き過ぎていたり、変なところで意図しない改行ができたりと、デザインがガタガタに崩れてしまいます。

EPUB制作に於いては便利でお手軽なデザイン手法ですが、将来PDFに出力して何らかの形でEPUBの再利用を考えている場合は、このあたりはきちんとCSSをつくってデザインを整えてください。CSSでレイアウトを整えることで、どんなデバイスやツールで閲覧しても見た目がさほど変化しないという、EPUBの品質も向上しますし、一石二鳥です。

ぜひご検討くださいますよう!


PDF関連デスクトップ製品「機能比較表」更新

「瞬簡PDF」シリーズの機能比較表

アンテナハウスのデスクトップPDF製品の機能比較表を7月20日に更新しました。

上記は弊社のPDFデスクトップ製品のうち、「瞬簡PDF 統合版 」や「瞬簡PDF 統合版 」に含まれている下記製品の機能比較表です。

  • 「瞬簡PDF 作成 8」は、PDFを簡単に作成するソフト
  • 「瞬簡PDF 編集 7」は、PDF作成に加えて、PDFの文字編集や画像の差し替ができるソフト
  • 「瞬簡PDF 変換 10」は、PDFからOfficeなどの形式へ精度よく変換するソフト
  • 「瞬簡PDF 書けまっせ 7」は、用紙PDFへのデータ書き込み・追記に特化したソフト
  • 「瞬簡PDF 統合版 10」は、PDFの編集操作に加えて、上記の4製品プラス「瞬簡PDF OCR」をセットにした製品(※同梱製品は「瞬簡PDF 変換  9」)
  • 「瞬簡PDF 統合版 10 官公庁向け」は、「瞬簡PDF 統合版 10」プラス「瞬簡PDF to Image」「瞬簡PDF サイン 2」をセットにした製品(※同梱製品は「瞬簡PDF 変換  9」)

PDFはその作成から加工まで実にたくさんの処理があります。効率よく作業するには、その目的に最適化されたツール(ソフトウエア)が便利です。弊社では、それぞれの製品について、利用イメージを想定し、その用途において必要な機能を備え、使い易く、コストパーフォーマンスの良い製品を作りたいと考えています。

弊社製品の選択や他社製品との比較等にぜひご活用いただければ幸いです。


だれでもオッケーグーグル!

こんにちは。
おとといから雨が降り続いています。
ここらあたりは、梅雨に入ってからのほうが雨の量が少なく、この夏は水不足か?!と危ぶまれましたが、この3日間くらいで平年の7月1か月分くらいの雨量になるそうです。
止まない雨はない・・・と信じて、週末を乗り越えよう。。

先日、F1の結果を知りたくて、Nexusに向かって「えふわん!」と話しかけたのと同時くらいに
そばでネコが「にゃ~」とないたら、グーグルさまは「えふわんにゃ~」で検索してくれました。
オッケーグーグルは、ヒト(ネコ?)を選ばない。

別の日、知人が、Siriが認識してくれないというので、代わってちょっと試したら、別になんともない、ちゃんと認識してくれました。
じゃあ、というので、知人が再度挑戦すると、「わかりません」
いろんな言い方で話しかけていましたが、Siriは知らんぷり。
なにが気に入らなかったのだろう・・・

音声認識も好き嫌いがあるんでしょうか。
新しいものについていけてないので、AIスピーカーのPR動画も「ほんとか?!」とつい疑い深い目で見てしまいます。
技術の進歩はいいことですが、ほんとうに困っている人を助ける技術が早く実用化されてほしいものです。
言いたいことがうまくことばにできなくなった人がいて、毎度、それを汲み取るのに苦労します。
思考を映像化、文章化できたら、もうちょっと楽しく暮らせるのになあ。。。

では、また。


ペーパーレス:用紙サイズの呪縛?

今日、お昼ご飯を食べに行ったときに、ネットニュースを見ていると「参議院でペーパーレス化」といった記事が上がっていました。衆議院議員に配られている紙の報告書などを電子化してペーパーレスにすることが決まったようです。

どのようなシステムで、どのような運用で行われるのか。
墨消しや電子署名、タイムスタンプ、はたまたブロックチェーンなどを使っているのか、興味が湧くところです。

ペーパーレスといえば以前に「モバイルファーストな文書」という記事を投稿したのですが、Wordなどの文書作成ソフトにはモバイル端末に適した表示サイズのテンプレートや仕組みがありません。今どきはスマホのように小さな画面からパソコンのようい大きな画面、縦長、横長など様々な画面があるため、これらに最適に対応するにはレスポンシブに表示される必要がありますが、紙に印刷するための用紙サイズが前提になっています。
ですので、ペーパーレスといっても、メールで送られてくる文書はA4サイズが多いです。
場合によっては見積書などは紙に印刷したものをスキャンしてPDFにして添付されてくることもあります。

紙に印刷するコストの削減や資源の節約、郵送にかかるか各種費用の削減という意味では効果がありますが、用紙サイズの呪縛があるために、印刷したくなる、あるいは印刷せざるを得ないといったことになるかもしれません。

用紙サイズの概念がなくなれば、あるいはWebサービスで共通の文書フォーマットや共通で情報を参照できる仕組みができれば、もっとペーパーレス化は進むのではないでしょうか。

ただし、この用紙サイズの呪縛のおかげでPDFはまだ当分の間は需要がありそうです。


『PDF Cook Book』シリーズ PDF Tool APIを使うPDFの料理法 のご紹介

PDFの料理本『PDF CookBook』(4月発売)および『PDF CookBook第2巻』(6月発売)は、PDF Tool API V5のクラスライブラリーを使ってできるPDFの様々な加工法を紹介しています。

『PDF CookBook』
PDFのページ編集(PDFの分割・結合・ページの回転)、ページサイズ、方向および余白の変更、PDFのページにテキスト・画像・PDFを貼り付けなどを中心に解説・活用例とプログラム例を解説しています。詳細はこちらへどうぞ

出版社: アンテナハウスCAS電子出版
発売日:2018年4月
著者:アンテナハウス株式会社
販売形式:プリントオンデマンド版
サイズ:B5判 横組み
ページ数:124ページ
価格(税込):1,728円
ISBN:978-4-900552-60-9
販売店:アマゾン(POD版)(4月6日発売)、その他Web書店で発売予定

販売形式:PDF版(DRMなし)
ページ数:122ページ
価格(税込み):864円
販売店:アンテナハウス・オンラインショップ(PDFのダウンロード)

『PDF CookBook第2巻』
PDFのセキュリィティ(パスワードセキュリティ)、閲覧制限、透かし、しおりなどについて等を中心に解説・活用例とプログラム例を解説しています。詳細はこちらへどうぞ

出版社: アンテナハウスCAS電子出版
発売日:2018年6月中旬
著者:アンテナハウス株式会社
販売形式:プリントオンデマンド版
サイズ:B5判 横組み
ページ数:126ページ
価格(税込):1,728円 6月18日アマゾンで発売になりました。
ISBN:978-4-900552-61-6
販売店:アマゾン(POD版)その他Web書店で発売予定

販売形式:PDF版(DRMなし)
ページ数:126ページ
価格(税込み):864円 6月8日発売
販売店:アンテナハウス・オンラインショップ(PDFのダウンロード)※PDF版のダウンロードは自社ストアのみです。


PDFの「墨消し(墨塗り)事故」って、例の森友文書でも発生してた! まだポピュラーな問題なのでした

しばらく前から、ブログの過去記事のページビューを調べるようになりました。そうしましたら、ここ最近、2015年7月31日投稿の「PDFの墨消しは、塗りつぶすだけではだめなんです」が高い順位に上がっていました。

さほど面白い文章でもないのに、なぜなんだろう? と調べたところ、例の森友文書で起きていたんですね~ やはり奇妙な現象には原因があるのでした。墨消しがホットな話題とは!

日経と文春のWebの解説を読みました。

日経(6月13日)
森友文書でも発生、墨塗りPDFから漏洩 間違った対策

文春(6月15日)
森友文書で黒塗りしたデータが流出! なぜこんなミスが起きたのかを専門家が検証

日経の文章は理解し易いですが、文春の文章は理解しにくいです。文春の記事は編集者がチェックしていないんでしょうかね。

弊社デスクトップ製品では、『瞬簡PDF編集7』『瞬簡PDF 書けまっせ7』に、墨消し機能があります。

また、システム製品『PDF Tool API』でも墨消しができます。
現在、開発中の『PDF Tool API V6』では、検索でヒットした範囲を墨消し範囲に選択する機能が追加になります。


スープランチ

何を書こうかとこのブログを遡って読んでいたら面白かったです。
最初の投稿は2008年8月。
新ブログ: I love software! を開始しました。
もう10年近いんですね。

とはいえ、とくに面白いネタもひねり出せずに週末になってしまったので、今日のランチ紹介でも。
お昼にでるには少々歩くお店ですが。
BUCYO Coffee KAKO

001

入り口には謎の老人。

002
ランチメニューはこんな感じ。

003

ランチはこれにドリンクも付きます。

この15年くらいの間にすこしずつメニューが変わりお値段も変わりお店の名前も変わり…久しぶりにいったらお店の中が改装されて座席が増えていました。

変わるところは変えながら変わらずに在りつづけるのはすごいなあと。
帰り道途中の入れ替わりの激しいお店を眺めながら帰ってきました。
(馬肉屋さんができてた。)


Windows システムにインストールされているフォントについて

Office 文書を PDF に変換した際、作成した環境では大丈夫だったのにPDF Server を使って PDF に変換すると文字化けが生じるとのお問い合わせを頂き、調べてみた所、興味深い結果が得られました。

ユーザーからの報告では、文書中でフォント「Times New Roman」が指定されていた「※(U+203B)」が PDF ファイル上では「□」と出力されていました。
そこで、調べてみるとこのフォント「Times New Roman」は、使用している Windows 環境によって、インストールされているフォントのバージョンが異なり、そのバージョンによっては文字コードに対応する字形を持たないものがあることが確認できました。

現象の原因は、PDFServer を動作させている環境にインストールされていたフォントが、文字コードに対応する字形を持たないことにありました。
文書を作成した環境では、文字コードに対応する字形を持つフォントがインストールされていたため、文字化けすることなく表示・印刷できていましたが PDFServer を動作させていた環境にインストールされていたフォントは対応する字形を持たなかったため、文字化けが生じておりました。

このように同じ名前のフォントがインストールされているからと言って、それだけで作成した文書が意図したように表示されるとは言えません。
この様に思ってもいないようなトラブルが生じることがありますので、フォントの扱いには、十分にご注意下さい。


組版技術のカーニング

カーニングとは、プロポーショナルフォント(文字ごとに文字の幅が異なるフォント)で文字同士の間隔を調節する技法です。これによって文字の並びに美しさと、読みやすさが生まれます。

カーニングの語源は伝統的な印刷手法である活版印刷に遡ります。
活版印刷は文字のはんこを並べて本を印刷する手法です。
活版印刷では文字幅を調整するために、はんこの側面から字が彫ってある部分を意図的にはみ出させていました。そのはみ出た部分を「カーン」と呼んでいたことがその語源です。
現在はDTPが普及して、活版印刷を行う企業も少なくなりました。
しかし数百年前から職人達は地道な努力を重ねて印字の並びの美しさを追求していたのです。

今日ではカーニングはワープロソフトなどでも設定できるようになり、文字列の美を追究するのもずいぶんと楽になりました。それでも、目視で文字の間隔を調整する能力はあるに越したことはないでしょう。
ワープロソフトなどで、レイアウト調整のために文字間を手動で調整することだってありますね。

たまにはカーニングのセンスを磨くゲームで
http://type.method.ac/
鍛えてみても良いかもしれません。


PDFの未来―Webによるデジタル出版、PDFによるデジタル出版の相違

アナログ出版では、出版物は原稿素材ーレイアウトー印刷という工程で製作されます。そしてレイアウトはデザイナーの仕事です。それに対して、デジタル出版ではレイアウト処理という工程はソフトウェアによる自動処理となり、一般ユーザーには目に見えない神プロセスになります。このことは、先日、CAS-SUPPORTのブログで紹介しました[1]

今日は、続きとしてWebによるデジタル出版PDFによるデジタル出版との相違を考えてみます。

Webによるデジタル出版、すなわちWebページでは、素材はHTMLとして用意され、レイアウト指定はCSSとして用意されます。レイアウト指定は制作時に行うことになります。多くの場合CSSは、Webページ用に用意したものを調整して使います。こうして、デザイナーの仕事は大幅に変更になります。

HTML+CSSをレイアウト処理して画面に表示するのはブラウザの役割であり、レイアウトの指定とレイアウトの処理が異なるタイミング・異なるPC・異なるブラウザ環境で行われます。仮にデザイナーがデザインして公開前に動作を確認したとしても、ユーザーが持つ端末ではレイアウト結果が同じになるかどうかは保証されません。端末とブラウザの組み合わせによってはデザイナーが希望しないレイアウト結果になってしまっているかも知れません。

PDFによるデジタル出版ではAH Formatterのような自動組版ソフトを使うと便利です。AH FormatterはXMLやHTMLをPDFにする組版ソフトです[2]。特に、AH CSS Formatterは、HTML+CSSを可視化しPDFにできますので、AH Formatterが提供する機能はブラウザと似ています。

しかし、AH Formatterとブラウザには、本質的な相違が1つあります。すなわち、AH Formatterではレイアウト化・可視化処理をした結果をPDFにします。こうして作成されたPDFが配布されます。

PDFによるデジタル出版ではPDFは紙に印刷した結果と同じであり、レイアウト結果は完全に固定化されます。そして、ユーザーの画面上での表示結果が、予期しないレイアウトになることはありません。こうして考えますとPDFにより配布する方が送信側にも受け手側にも安心です。

ダイナミックなWebページに対してPDFはスタティックであると言っても良いでしょう。こうしてWebによるデジタル出版PDFによるデジタル出版にはレイアウトの固定化という面では大きな相違があります。この相違は本質的なものなので、将来も変化していく可能性は小さいと考えます。

[1] デジタル時代のレイアウトは、ユーザーの目に見えない神プロセス
[2] AH Formatter


Pages: 1 2 3 4 5 6 7 8 9 10 ... 102 103 104 Next