カテゴリー別アーカイブ: PDF のあれこれ

Acrobat の不満点(その2)

前回 に引き続き、Acrobat の不満点を書いてみます。

Acrobat にて PDF を作成し、印刷も視野に入れていたため CMYK の ICC Profile を出力インテントに指定して PDF/A-2 形式で保存しました。

PDF/A-2 ではベースバージョンが PDF1.7 となったため、PDF1.4 というベースバージョンの制約があった PDF/A-1 と比べて非常に有効なバージョンになります。
以下は PDF/A-2 によって実現可能となった機能の一部です。

  • PDF 1.4 -> PDF 1.5
    JPEG2000圧縮によるイメージ
    オブジェクトストリーム、Xrefストリーム(圧縮率の向上)
    オプショナルコンテント
    XFA Form
  • PDF 1.5 -> PDF 1.6
    暗号化機能の強化(AES暗号化の追加)
    カラースペース追加(DeviceN、NChannel)
  • PDF 1.6 -> PDF 1.7(ISO 32000-1)
    3Dアートワーク
    ポータブルコレクション

PDF/A-2 の詳細につきましては、PDF資料室 過去のブログ にまとめておりますので、参照ください。

さて、PDF/A-2 で保存した結果、出力された出力インテントが RGB の ICC Profile に置き換わってしまいました。
作成した PDF にはテキスト注釈、スタンプ注釈といった注釈が含まれていたのですが、この事が原因で強制的に RGB となってしまったのでしょうか。
PDF/A-2 の仕様では CMYK が使用できない、といった制限はありませんので、不思議な結果となりました。
CMYK の ICC Profile を出力する方法はあるのでしょうか。

<< その(1)


Acrobat の不満点(その1)

日頃 PDF ファイルの編集作業で Adobe Acrobat を使用する機会が多いのですが、使用している中で不満に感じている事を書いてみます。

PDF では対話フォーム(AcroForm)と呼ばれる、使用者から対話的に情報を収集するフィールドを持つことができます。
その中にはテキストフィールド、ラジオボタン、リストボックスといった使用者が入力するフィールドや、ボタンのようにアクションを関連付けて特定のページへジャンプするようなアクションを指定することができる便利な機能です。Acrobat では「ツール」の「フォーム」にて作成可能です。

この機能は PDF1.2 以降で使用可能な機能なので、使用している方も多いのではないでしょうか。

さて、この対話フォーム(AcroForm)を使用した PDF を作成し、PDF/A(*1) へ別名保存してみます。 ところが PDF/A として保存した PDF で、表示上はボタンの画像やテキストボックス風のエリア、ラジオボタン風の円が残るのですが、マウスクリックしても全く機能しません。
Acrobat では PDF/A 保存すると、外観だけを残して対話フォーム(AcroForm)の機能自体を削除してしまうようです。

確かに長期保存する文書で使用者との対話は不向きなのかもしれませんが、ボタンでのページ移動等のように便利な機能もあるので削除してしまうのは惜しいと感じています。

(*1)
PDF/A(ISO 19005の同義語)は、国際標準化機構 ISO が制定した国際規格 ISO 19005 に定められる PDF の形式の1つです。このファイル形式の第一の目的は、使用するツールにかかわらず、長期間に渡ってファイルの視覚的な外観を維持できること、第二の目的は、PDF の視覚的な外観ではなく、論理構造、意味といった情報を格納できるようにすることにあります。
PDF/A につきましては、PDF資料室過去のブログ にまとめておりますので、参照ください。

その(2) >>


年初 電子紙接近容易性配慮事情 摘み食い編

お正月のある日。
何をするでもない無為な時間を過ごすことは、人生にとって必ずしも無駄なことではない、むしろ贅沢なことだ、などと嘯いているのもそろそろ飽きてきたので、新たな見聞を広めるため、おもむろにPCを引きずり出してネットサーフィン(これも今や死語か)ならぬネット漂流に出掛けてみることとしました。

そんな中で、とある記事に目が留まる。
「視覚障害の方のインターネット利用は91.7%」。総務省が2012年に発表の調査データらしい。

アクセシビリティとユーザビリティの確保は、Webを製作する側も公開する側も配慮すべき優先課題であるのは今では言うまでも無いこと。その規格化は2004年から始まっているとのことだが、利用者側の情報について触れることはほとんどなかったので、利用率の高さに正直なところ驚いた。

夢うつつの漂流が現実に引き戻されつつある中で、こんな記事にぶつかった。
パソコンからインターネットを利用する際に困ることについては、全盲者では「スクリーンリーダーで読み上げられないPDFやフォームなどがある」(94.4%)が最も高い。

また別の調査では、「PDFファイルについては、画像のみでテキストが埋め込まれておらず読み上げないという問題と、読み上げ順序が文脈通りになっておらず、内容を理解しづらい」という問題の指摘が多い。「PDFによる解説は解読不能」との意見も。

最後に、とどめの一撃が。
質問:知りたい情報がPDFファイルで提供されている場合の利用方法。
回答:PDFファイルのみで提供されていた場合は読まない(18.24%)。

フルボッコです。
「これでいいのか、PDF!アクセシビリティはどこへ行った?」

2016年4月1日、障害者差別解消法は施行された。

正月気分も冷めやらぬ中、俄か知識を引っ提げて、アクセシブルなPDFの普及が急務であると、ドヤ顔で語っておりましたところ、ある制作会社さん曰く。
「もう2~3年前から手掛けてますよ、うちは。官庁・自治体のお客様が多いから必須なんですよ。ただ、加工が大変でして、簡単にPDFにタグがつけられるツールとかありませんか。」
己の見識の狭さに赤面しながら、「流石、法定義務を課せられているだけあって官庁は動きが早いですね。努力義務の民間のお客さんはまだまだでして・・・・ははは」としどろもどろの言い訳に、赤っ恥のボディブローがジワリと効いてくる。

「が、頑張っているじゃないかぁ、PDF!」

印刷用の版下に、どうしてアクセスビリティが必要なの?
その疑問ももっともですが、PDFの活用はそのレベルで十分とお考えですか。

昨今は印刷物とHTMLをセットで納品するのが当たり前、PDFをWebにあげなくてもとのご意見もありますが、印刷物のレイアウトを広く共有するためにPDFでなければならない場合も多々あります。

必要とされる以上、対応しないわけにはいかない。
それにしても、できあがったPDFに後からタグを追加する作業の効率の悪さ。
PDF/UAでは、形式的、意味的に厳密なタグ付け(マークアップ)が求められています。
アクセシブルなPDFの普及を妨げる要因が、それらPDF仕様の複雑さとアクセシビリティ要求の高さにあるとすれば、現状の改善は望めないのでは・・・・・。

いえいえ、アンテナハウスにお任せあれ!
解決法はオリジナル文書の段階で階層化、マークアップしてしまう以外にはありません(断言)。

構造化文書からどうやってアクセシブルなPDFを?
『AH Formatter V6.4』はPDF/UA出力機能を実装しました。

アンテナハウスは、一つのコンテンツから印刷用PDFとアクセシブルなPDFを自動生成すると共にHTMLも作成する、ワンソースマルチユースのもう一つの応用を提案します。

製品紹介・実演をご希望の方は、2月8日から開催のPAGE2017(BT-8)にてお待ちしております。

【参考資料】


アクセスブルなPDF(第2回)

こんにちは!
本日は PDF の言語指定に関して説明します。

  1. 言語指定
    言語の指定はIETF の規格「RFC 4646」に従います。
    言語の指定は言語コードとカントリーコードからなります。 言語コードは一般的にに小文字を使用し、カントリーコードは一般的に大文字を使用しますが、 大文字/小文字は区別しません。

    文字指定の例を示します。
    en-US  英語  米国
    en-CA  英語  カナダ
    zh-CN  中国語  簡体字、中国
    zh-Hant  中国語  繁体字
    ja  日本語
    ko  韓国語
    fr  フランス語
    fr-CA  フランス語  カナダ

  2. 言語指定の箇所
    PDF 全体と、個別の要素ごとに言語を指定できます。
    各国の言語が混在している場合に対応できます。

    (1) PDF 全体の言語指定
    PDF 全体の言語指定は、ドキュメントカタログ内の Lang エントリで指定します。

    (2) 構造化要素の言語指定
    アクセスブルな PDF は構造化されており、 構造化辞書が存在します。
    構造化要素の要素辞書にLang エントリが有ります。
    このLang エントリで個々の要素の言語を指定します。

    3) 構造化要素以外のコンテンツの言語指定
    マーク付きコンテントシーケンスを使用します。Span タグ属性のLang エントリで言語を指定します。
    (例)

    BT  % テキスト開始
    	( アーノルドは ) Tj
    	/Span << /Lang (es-MX) >> 	% マーク付コンテント開始 スペイン語
    	BDC
    		(Hasta la vista.) Tj
    	EMC 	                                          % マーク付コンテント終了
    	(と言った。) Tj
    				
    ET  % テキスト終了
  3. 次回
    文字が unicode でエンコーディングされている場合は、言語指定との関係がどうなるのかを考えます。 また、PDF1.5 では、「多言語テキスト配列」が定義できますので、とりあげてみたいと思います。
    (多言語テキストの例)
    [ (en-US) (My vacation) (fr) (mes vacances) ( ) (default text) ]

今回はこれまでです。


アクセスブルなPDF(第1回)

こんにちは!
初回は、アクセスブルな PDF の概要を紹介します。

PDF は、障害を持つユーザがドキュメントを利用しやすくするために、いくつかの機能を持っています。
多くの視覚障害を持ったユーザは、ドキュメントを読んで、音声に替えるスクリーンリーダを使用します。

PDF は、スクリーンリーダが適切な発声をするために、次の四つの機能をサポートします。

  1. PDF ドキュメント内のテキストに対して自然言語を指定することができます。
    (自然言語とは、日本語、英語、スペイン語等です。)
  2. イメージなどのテキストに翻訳されないオブジェクトに、代替テキストを指定することができます。
  3. リガチャ(合字)、イルミネーションテキストなどに、代替テキストを指定することができます。
  4. 略語やイニシャルに対して、展開形式のテキストを指定することができます。

アクセスブルな PDF を実現するための、最も中心的な PDF の仕組みは、次の二つです。

  1. タグ付き PDF であること。
  2. ページのレイアウトから独立して、PDFドキュメント内のコンテントが、論理的構造順に取得可能であること。

アクセシビリティアプリケーションは、障害を持つユーザのために、構造階層のノードを自由に行き来して、ドキュメントの情報を抽出します。アクセスブルな PDF とは、構造階層経由で、ドキュメント内の全情報を取りだすことができなくてはなりません。

テキストはタグ付き PDF から抽出することができます。
取り出したテキストは、アクセシビリティ以外の目的のために検索したり、再使用することができます。

Web 上のコンテントのアクセシビリティサポートのためのガイドラインは、W3C ドキュメント Web Content Accessibility Guidelines で説明されています。

以上、アクセスブルな PDF の概要です。


Windows 10 の PDF 表示機能

Windows 10 では Microsoft Edge の一機能として PDF 表示が行えるようになっています。

http://ondoc.logand.com/d/223/pdf
の表示を試します。

PDF表示機能01

赤丸で示した場所に少しエラーがあるようです。
CMYK Color と 縦書きのテキストの部分です。

PDF表示機能02

以前 Windows 8 の Windows Reader を試した時と同じようです。
PDF 表示機能の比較


『PDFインフラストラクチャ解説』出版報告&特別講演会開催のお知らせ

アンテナハウスブログ「I love software」で、2005年10月~2008年7月の1000日間に亘って連載された「PDF 千夜一夜」に、2015年までに集めたPDF関連の情報やオリジナルの内容を加筆修正し、網羅的にまとめあげたものが、『PDFインフラストラクチャ解説:電子の紙PDFとその周辺技術を語り尽す』として出版します。

現段階では、Kindle ダイレクト・パブリッシング(KDP)で出版開始され、もう間もなくペーパーバックでも出版される予定です。

さて、そんなPDFに関する知識が満載された『PDFインフラストラクチャ解説』の出版を記念し、2月16日(火)、講演会を開催します。
PDFにおけるあれやこれを、いろいろ訊けるチャンスです!

『PDFインフラストラクチャ解説』出版記念特別講演会

  • 開催日時: 2016年2月16日(水)16時00分~18時10分
  • 開催場所: 市ヶ谷健保会館 E会議室
  • 参加費講演会のみ: 1,000円(税込)
  • 定員: 30名(事前予約制)
  • 詳細・お申込みURL:http://peatix.com/event/138690

ゲスト
松木眞氏(画像電子学会フェロー):PDFの国際規格ISO32000やPDF/Xなどの派生規格の作成等に参加。
ISO32000:PDFの国際規格の現状と将来について(仮)、いろいろ語っていただきます。

●『PDFインフラストラクチャ解説:電子の紙PDFとその周辺技術を語り尽す』

PDFインフラストラクチャ解説(表紙)

目次・書籍詳細
https://www.antenna.co.jp/pdf/reference/pdf-infra.html
(青い「目次紹介」をクリックすると、目次が表示されます)

本書のご購入は、こちらからどうぞ!
Amazon Kindleストア

エンドユーザーではなく、「技術者向け」の内容です。
(もちろん、技術者でない方でもPDFの成り立ちや、なぜそこにPDFが使われるのかなど、仕事仲間と話題にできる蘊蓄を仕入れられます)
PDFの仕様、製品に実装するための必要な技術情報など、PDFを中心に組版に必須のフォントや文字などの関連項目について解説。PDF登場の経過や歴史的側面の解説も多いので、読みごたえはあるかと思います。
昨今話題の電子署名やタイムスタンプ、長期保存、PDFから別のファイル形式(Officeやimgなど)への逆変換などにも解説しています。

●PR●
PDFに関する疑問にお答えします。「PDF資料室」:https://www.antenna.co.jp/pdf/reference/


アンテナハウスWebの人気コンテンツ PDF資料室にPDFについての解説集を改訂しました。

【質問】「PDFとはなんですか? PDFにするとどんなメリットがありますか?」

仕事でパソコンを使っている人はもとより、自分の趣味で Webページを検索したり、メールで情報を交換しはじめた人が最初に面食らうのが、PDFファイルではないでしょうか? ここではPDFとは何かという素朴な疑問に答えてみました。

【質問】PDFは編集できるの? どうやって編集するの?

PDFを作成して配布したり、あるいはメールでの受け渡しが広く行なわれています。受け取ったPDFに文字や図形を書き込んだり、削除・追加するなどのいわゆる編集をしたいとき、どのような方法があるか、気を付けたい点などを整理しました。

【質問】PDFをWordやExcelの文書に変換できますか? また、具体的にはどのような方法がありますか?

PDFファイルをWordやExcelなどのオフィスファイルに変換して、他の人からもらったPDFや、自分や会社の同僚が昔作ったPDFの文章や画像を利用し、編集を加えたり、あるいは自分の作る文書への取り込みができます。その方法と注意事項を整理してみました。

【質問】PDFのフォントの埋め込みとはなんですか?

PDFは日本語の扱えない海外のパソコンや携帯端末でも日本語が表示できるなど、環境に依存しない電子文書を実現できます。そこで使われている鍵となる技術がフォントの埋め込みです。コンピューター上で電子文書を実現するために文字コードやフォントの技術は欠かせないものです。私たちが日ごろ当たり前のように接している文字が、コンピューター上でどのように扱われているのかを知ることは、PDFのメリットのひとつであるフォント埋込機能の理解にもつながります。ここでは、千年後でも読める電子文書の実現の肝となるフォント埋込技術についてわかりやすくご紹介します。

【質問】PDFへコメントを記入できますか? 文字を追記できますか?

PDFには注釈(Annotation)という機能があります。注釈はコメントや図形、校正記号などのマークアップをあとからPDFに付加する用途で使うものです。PDFの注釈には用途別に様々な種類があります。注釈の概要やPDFへの文字の追記(コメントの追加)で注意すべき点をまとめてみました。

【質問】PDFを作成する仕組みを知りたいので、わかりやすく教えてください

PDFの作成方法は、アドビシステムズ、サード・パーティ製品を含めて非常に多岐に渡っています。ここでは、それらを技術的な仕組みという観点でまとめてみました。この文書は、「PDF千夜一夜」からPDFの作成関連の話題をピックアップして整理したものです。説明不足や誤りはできる限り加筆訂正に努めましたが、内容を保証するものではございません。

【質問】オフィス文書やPDFをWebブラウザだけで作成するサービスがありますが、詳しく教えてください。

PDFもクラウドが主戦場、新たな戦国時代の始まりです!! PDFという切り口から関連する様々なWebサービスをご紹介します。

【質問】PDFの記入用紙に書き込む良い方法はないでしょうか?

他の人から受け取ったりWebからダウンロードしたPDFを、紙に印刷するのではなく、画面上でそのまま文字や図形を記入したいと思った方は多いのではないでしょうか。Yahoo!知恵袋などの質問サイトにも「PDFに記入したいがどうしたら良いか」といった質問が多数見受けられますが、注釈での記入など長期保存や印刷用に不向きな方法が多く紹介されています。ここでは、既存の記入方法の問題点を整理し、それらとは違う弊社製品『瞬簡PDF 書けまっせ』の手法についてご紹介します。『瞬簡PDF 書けまっせ』を使うとPDF用紙に超簡単な手順で記入ができます。PDF用紙への記入に特化した各種機能は、業務用途での高度な記入作業も強力にサポートします。


Antenna House Regression Testing System (AHRTS)
Antenna House Formatterを自動でリグレッションテストするツール

2011年にUSアンテナハウスのサポートチームはAntenna House Formatter のリリース時の社内テスト用に自動のリグレッションテストシステムの開発をスタートしました。当時はおよそ1,000程の文書(10,000ページ以上)を使ってテストを行っていましたが、数人で作業して2,3日は掛かりました。スクリーン上の目視で、正しいPDF表示との見比べを左右並べて行っていたからです。

リグレッションテストは開発やリリースの過程で重要なステップですが、時間と人手間が掛かり、目視によるためそれほど正確ではありませんでした。

リグレッションテストのプロセス自動化を行うに当たって、次の様な課題が持ち上がりました。

  • コードではなくビジュアルなPDFを比較できるツールであること。なぜならPDFの内部構造は違うかもしれないが同じように見えることが大事だから。
  • 大容量の文書をテストすることができ、どこが違うか、差異をレポートできるツールであること。
  • 従来の方法より早く処理可能なこと。

こういった要求を満たすツールを探したがなかなか見つからなかったので、独自のソリューションの開発を始めたわけです。六か月ほどして、サポートチームはPDFをビットマップに変換しページをピクセルで比較するシステムを開発しました。この初版のツールを使っていままで何日もかかっていたテストが一日でできるようになりました。次のワークフローはこのシステムの詳細な過程を示しています。このシステムを使って、PDF単体の比較や、PDFを格納してあるディレクトリ単位でもテストが可能となりました。

20140605-01

レポートは実際にはAntenna House Formatterで生成され、3つのパネルに配置されます。

20140605-02

左のパネルはベースラインから抽出したオリジナルのPDFで、右のパネルは新しい文書から抽出したPDFです。AH Formatterの機能を使って個々のページをPDFから選択して一つのPDFにマージすることも可能です。真ん中のパネルは2つのページの差異をハイライトで示したビットマップの合成です。オリジナルと新規の文書でどんな種類の違いが生じたのか特定できるよう、その差異を色別に示しています。違いを含んだページのみをレポートに含むことが重要と考え、その方針で、もし500ページ中4ページだけ差異がある場合、その4ページのみを見るだけで済むようになっています。

その後更に開発を続けパーフォーマンスは飛躍的に改良されました。ユーザーフレンドリーなGUIを立ち上げインストーラを作成し、5分以内でソフトウェアをインストールが可能になりました。また、Windowsに加えて、Linux Macにも対応しました。

現在では、このシステムを使って2時間以内でテストを終えることができ、どんな差異も見つけることができると自負しています。弊社のFormatterの定期リリースや、改訂リリースがテストのために遅延するということはなくなりました。また、この上質なテストを行うことで、品質がかなり良くなっていることが判明しました。

リグレッションテストシステムは現在Antenna Houseの商品として販売しています。詳しい情報についてはこちらをご参照ください。

http://www.antennahouse.com/antenna-house-regression-testing-system/


JATSをPDFに

先日、学術情報XML推進協議会さん主催のセミナーにお招きいただき、「XML自動組版を実践する」というテーマで2時間近くお話させていただく機会がありました。いつもは30分とかせいぜい1時間くらいお話しさせていただくことが多いのですが、2時間というのは相当長い時間をいただいたことになります。
ご参加者者は35名くらいだったでしょうか。お申し込みはもっとあったようですが、会場のキャパの関係で途中で受付を打ち切られたそうです。そういうお話を聞かされたらこちらも気合が入ります(笑)。

まずXMLの一般的な話題から入って、それをPDFにするための手段について話を進めます。

XMLの具体例

XML→XSL-FO→PDF

そしてXSL-FOの概要説明を経て、XSLTスタイルシートの説明。

XSL-FO の具体例

XSLTスタイルシートの例

XSLTスタイルシートの例

最後に、どうやってJATSを入力するのか、ということで今回はoXygenを使って実際に入力するところをご覧いただきました。

昨年も、学術情報XML推進協議会さんにはセミナーにお招きいただき、そのときは主にHTMLに変換するためのXSLTスタイルシートの作り方のお話をさせていただいています。
JATSに限らず、もしXMLの自動組版について話が聞きたいという方がいらっしゃいましたら、いつでもご連絡ください。お待ちしております。


Pages: Prev 1 2 3 4 5 Next