カテゴリー別アーカイブ: PDF活用

『瞬簡PDF 作成 7』の便利な新機能

瞬簡PDF 作成 7 の便利な新機能

先週発表した『瞬簡PDF 作成 7』は新しい機能として次の実装をしました。

TWAIN対応のイメージスキャナーからの取り込みに対応
画像ファイルを回転してPDF作成
IE用のアドインボタンからPDF作成
PDFの一括回転

これらは日ごろお客様から寄せられた、お問い合わせやご要望などを参考にさせていただき追加した機能です。一見地味な機能のように思われるかもしれませんが、実際にご利用いただいているなかから出てきた貴重なご意見は、あると便利なものも多いと思います。

「画像ファイルを回転してPDF作成」「PDFの一括回転」についてはそれぞれ「画像ファイルのPDF変換時のオプション」、「各処理後の出力PDFへの出力オプション」といったオプションとして設定するものとなります。メインの機能としての実装ではないため若干設定箇所がわかりにくいかもしれません。

新機能について利用方法や設定方法についてまとめたページを用意しましたので、ご参考になれば幸いです。

⇒ 『瞬簡PDF 作成 7』新しい機能

投票をお願いいたします

瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品！

HTML on Word
WebページをWordで作る！

『瞬簡PDF 作成 7』新発売！スキャナー読み込み対応とIE用アドオン機能の追加でPDF作成をより簡単に！

瞬簡PDF 作成 7 パッケージ

先週10月22日に、PDF作成ソフトの新バージョン『瞬簡PDF 作成 7』を発表しました。
今回のバージョンアップでは、イメージスキャナーからの読み込み機能で紙文書をスキャンして一括でPDF作成できるようになりました。また、IE（Internet Explorer）用のアドオン機能を追加し、見ているWebページをボタンクリックで簡単にPDF作成できます。

⇒ ニュースリリース：スキャナー読み込み対応とIE用アドオン機能の追加でPDF作成をより簡単に！『瞬簡PDF 作成 7』新発売

⇒ 『瞬簡PDF 作成 7』製品案内

アンテナハウス直販のオンラインショップでは、ダウンロード版、パッケージ（CD-ROM）版ともに先行発売を開始しています。
量販店などでは11月下旬から店頭販売される予定です。

⇒ アンテナハウスオンラインショップ『瞬簡PDF 作成 7』

新しくなったポイント

Windows 8.1 に対応
TWAIN対応のイメージスキャナーからの取り込みに対応しました。スキャン画像から簡単にPDFへ変換します。
画像ファイルを回転してPDF作成。取り込んだスキャン画像の向きを回転してPDFを作成します。
PDFの一括回転。PDFが横向きだったり、上下が逆の場合に一括で回転して修正できます。
Microsoft Internet Explorer用のアドインボタン機能を追加。見ているWebページをボタンクリックですぐさまPDFに出力します。

『瞬簡PDF 作成 7』はおかげさまで、企業や官公庁、教育機関などで、多くのライセンスをご導入いただいています。シンクライアント環境での動作も確認していおりますので、安心してシンクライアント環境へご導入いただけます。

⇒ 『瞬簡PDF 作成 7』のシンクライアント対応について

また、ライセンス数を気にすることなくご利用いただける事業所規模に応じたライセンス「AH-ULL」（エーエイチ－ユーエルエル：Antenna House-Unlimited License）は大変お得になっております。

⇒ 企業や自治体、官公庁向けのお得なライセンス『AH-ULL』

投票をお願いいたします

HTML on Word
WebページをWordで作る！

アウトライナー
PDFを解析してしおり・目次を自動生成

続・OCRのよもやま話

先日、JR東海から2027年度に開業が予定されるリニア新幹線の概要が発表されました。多くのメディアで取り上げられましたので興味を持って見られた方も多かったのではないでしょうか？
弊社の伊那支店がある長野県南部にもリニア新幹線の新駅ができる計画で、地元紙でも大々的に記事が掲載されました。これまで夢としてしか語られなかったことがにわかに現実味を帯びてきたことで、谷あいののどかな地方にこれからどのような風が吹きこむのか、住人としても目が離せない気がします。

閑話休題。

昨年の7月頃に『OCRのよもやま話』という記事を書きました。
今回はその続きということで、OCRにまつわる話題をいくつか追加したいと思います。

OCRと解像度

OCRとは、Optical Character Recognition（あるいはReader）の略で、紙に印刷された文字をイメージスキャナなどで読み取り、画像化された情報から文字情報を抽出する技術であることを以前の記事でご紹介しました。

OCRで文字を正確に取り出すために必要な要素を考えると、おおよそ以下の点が挙げられると思います。

元になる原稿の状態が良好であること（文字が鮮明で、紙に汚れや皺がないなど）
適切な解像度でスキャンされていること
OCRソフトが適切な性能であること

このうち、2）の「解像度」について取り上げます。

OCRで使う解像度はスキャナなどで取り込む画像の品質を表すもので、dpi（ディーピーアイ）という単位を使います。これは、1インチ（2.54cm）の間隔にどれだけ物理的な点（画素）が配置されているかを示すもので、同じ大きさの画像で比べた場合は、解像度の値が大きいほど高精細な画像が得られます。

解像度は別の言い方をすると、1インチあたりの画素の密度を表すということができます。密度が濃ければそれだけ細かい描写が可能になります。以下はそれを模式図にしたものですが、文字のサンプルにあるように解像度が小さいと曲線などで滑らかな表現ができなくなります。

解像度

では、実際に異なる解像度でスキャナから取り込んで比較してみましょう。

以下は、スキャナの設定でそれぞれ 200dpi／400dpi に解像度を変更してJPEG形式に保存したデータの一部を示しています。

解像度の違い

ちょっと分かりづらいかも知れませんが、ブラウザの表示倍率をあげて見ていただくと両者の違いが分かります。
以下は、この二つの画像を弊社のOCR変換製品『瞬簡PDF OCR』でテキストファイルに変換した結果です。

変換結果

解像度が200dpiだと文字化けしてしまう箇所が、400dpiでは（完全ではないですが）おおむね正しく認識できていることが確認できます。

そうすると、もっと解像度を高くしてスキャンすれば更に良い結果が出せそうに思えます。ところが、これがさにあらず、なのです。
以下は、スキャナの設定を600dpiにして変換を行った結果です。

600dpiで変換

解像度を上げても、あまり変換結果に影響がないことが確認できるかと思います。
一般にOCR処理では、300～400dpiの範囲が適切なOCR結果を得る解像度だと言われています。それ以上解像度を上げてもファイルサイズが大きくなるばかりで、OCRの変換精度はあまり変わらないか、逆に悪くなってしまう場合もあります。ちなみに今回使用したJPEGデータの場合、400dpiのときのファイルサイズは約1.4MBですが、600dpiでは約2.7MBでした。

OCR処理を使って文字の取り出しを行う際には、スキャンの段階から適切な解像度を設定していただくことでより良い結果が得られます。ご参考にしていただければ幸いです。

※『瞬簡PDF 変換8』、『瞬簡PDF OCR』は製品の体験版を公開しております。是非、お試しください。

投票をお願いいたします

瞬簡PDF 変換 2024
PDFをOffice文書へ高精度変換

瞬簡PDF 書けまっせ 2024
PDFに文字が書ける！入力欄を自動認識

PDF/UA(ISO 14289-1)について（終）

PDF/UAの紹介の最後になります。

ここまで、ファイルフォーマットの要件、リーダの要件を記載しましたが、最後はAT(Assistive Technology:支援技術）の要件になります。

このATにはPDF/UAを使用するスクリーンリーダや、音声入力をサポートするデバイス、キーボード入力を容易にする装置、点字に変換して印刷するソフトウェアなど広範なソフトウェア、ハードウェアが含まれます。

ATに求めら得る要件とは、大きくは下記となります。

この仕様に定められた構造型、属性、値をユーザが好む方法で利用、表示できること、論理構造ツリーに属さないアーティファクトを処理する機能があること。
準拠リーダが複数の表現方法で表示する場合、ATはユーザの選択する方法でその表現にアクセスすることを可能としなければならない。
（この複数の表現方法とは、PDFのオプショナルコンテントあるいはレイヤーなどと呼ばれる機能を使用した表現方法のことです）
ナビゲーション機能として、以下をサポートする必要があります。
- PageLabel数値ツリーを用いてナビゲーションする機能
- 構造階層を用いてナビゲーションする機能
- ドキュメントのアウトライン(Adobe Readerのしおり）を用いてナビゲーションする機能
- ユーザ指定に応じたズーム機能

PageLabelとは、たとえば、目次部分は小文字のアラビア数字、本文はローマ数字といったページ番号を持つ文書がありますが、PDFでそのような表現をする機能です。ナビゲーションに、このPageLabelや、文書の章・項といった論理構造の階層情報を使用する機能が必要とされます。

ATの要件については、あまり詳細なことは定められていません。

以上、PDF/UAの紹介となりますが、フォーマットの要件部分で、関連仕様に W3Cの Web Content Accessibility Guidelines(WCAG) 2.0 があることを記載しました。
これまで説明したPDF/UAファイルの作成、使用の双方に必要とされる要件は、PDFファイルをW3Cの勧告であるWCAGに沿って利用するために必要とされるPDFの機能の使用方法となります。

PDF/UAの理解には、WCAG 2.0 （およびその関連ドキュメント）で解説される内容を理解する必要があります。
WCAGのW3Cの勧告は下記にありますので、興味のある方は参照ください。
http://www.w3.org/TR/2008/REC-WCAG20-20081211/
（日本語訳）
http://www.jsa.or.jp/stdz/instac/commitee-acc/W3C-WCAG/WCAG20/

投票をお願いいたします

アウトライナー
PDFを解析してしおり・目次を自動生成

瞬簡PDF 書けまっせ 2024
PDFに文字が書ける！入力欄を自動認識

PDF/UA(ISO 14289-1)について（３）

間があいてしまいましたが、以前のPDF/UAの紹介の続きになります。
PDF/UA(ISO 14289-1)について
 PDF/UA(ISO 14289-1)について（２）

今回は、PDF/UAのリーダ側の要件をまとめてみます。

全体としては、ISO 32000-1:2008で定義されているドキュメントの論理構造とアーティファクトを処理する能力を持つこと、および、ATとのインターフェース機能を持つこと、とあります。

AT(Assistive Technologies：W3CのWCAG2.0の邦訳では「支援技術」という用語が使用されていました。)とのインターフェース機能とは、

構造タグのタイプ、属性、およびキーの値に対するアクセスの提供およびオプショナルコンテントグループの可視状態を考慮した表示能力
アーティファクトをATが利用できるようにすること
ユーザインタフェースが存在する場合、それをATが利用できるようにすること

とあります。
（ここの「アーティファクト」ですが、PDFではドキュメントの著者によるオリジナルのコンテント（リアルコンテント）以外の、ページ付けやレイアウトのために生成されたオブジェクトをアーティファクトと呼んでいます）

以下、PDFの各オブジェクトに対して個別に記載されている要件となります。

テキスト

・論理的な読み込み順番をATデバイスが利用可能であること
・文字コードを適切に処理する能力があること
・自然言語、およびその変更をATデバイスが利用可能であること

表

表のセルが空である場合、その情報をATデバイスが利用可能であること

オプショナルコンテント

オプショナルコンテントを含む場合、複数の表現が選択可能となることがあるが、すべてのオプショナルコンテントを表示する手段を提供し、オプショナルコンテントコンフィギュレーション辞書の階層を表示する手段を提供すること
（このようなドキュメントの例として、多言語ドキュメントで、オプショナルコンテントを使用して、各言語別の表現をサポートしているようなドキュメントがあります）

添付ファイルと埋め込みファイル

構造ツリーに存在していない添付ファイルを利用可能とすること
埋め込みファイルの名称を表示するためにメカニズムを提供すること

デジタル署名

デジタル署名されていることをユーザに報告し、デジタル署名の証明書属性と有効性の状態を提示できること

アクション

アクションがドキュメントの可視状態を変更する場合、ATがその変更を利用できること

メタデータ

ドキュメントのCatalog辞書のMetadataストリームにおけるすべての要素をATが利用できること

ナビゲーション

論理階層構造やしおりを使用してナビゲートする機能を持つこと

注釈

各注釈の代替え記述をATデバイスに利用可能とすること

フォーム

ウィジェット注釈のテキスト記述をATデバイスに利用可能とすること

マルチメディア

動的にではなくユーザの要求に応じて再生すること

PDF/UAの読み手にはこれらの機能が必要とされています。

投票をお願いいたします

瞬簡PDF 作成 2024
ドラッグ＆ドロップでPDF作成

瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品！

出力結果の PDF に勝手にリンクが作成されてしまう現象

AH Formatter 担当です。

AH Formatter から作成した PDF 内に
指定していない外部リンクが作成されているというお問い合わせをいただくことがあります。

たとえば文書内に
https://www.antenna.co.jp/
といった URL を示す文言があり（確認用 PDF）、
それが勝手に外部リンクになっているという現象であれば、
ご使用の Adobe Reader や Acrobat の機能によるものと思われます。

Adobe Reader X でしたら、
[編集] – [環境設定] の「一般」にある「URL からリンクを作成」という項目が該当します。
ダイアログ

これをオフにすると URL の文字列が外部リンクになるという現象がなくなります。

参考記事（2024/6/7公開）

本ブログのより詳しい解説記事を次に用意しました。関心をお持ちの方はご参照ください。

投票をお願いいたします

瞬簡PDF 編集 2024
かんたん操作でPDFを自由自在に編集

アウトライナー
PDFを解析してしおり・目次を自動生成

知っておきたい便利なコワザ機能－その３－

『書けまっせPDF』の知っておくと便利な機能を4回に分けて紹介していますが、今回、第3回目は「テキストボックスの背景色」機能を紹介します。

PDFを編集する際に、元々ある文字や画像などを隠して、その上に文字を入力したいといった場合があります。

「書けまっせPDF」ではそのような場合、
「修正テープ」機能を使用して隠したい領域を指定した上で、テキストボックスを挿入して文字を入力します。
しかし、テキストボックスに背景色を設定することで同じような結果を実現することができます。

操作は、まず隠したい領域にテキストボックスを作成し、
プロパティペインに表示されるテキストボックスのプロパティから背景欄にある色を選択します。

背景色の指定

背景に合った色を選択（スポイトで背景色をそのままクリックするのも可）することでテキストボックスに背景色が設定され、PDFの文字が隠れます。

背景色を指定後

そのまま文字を入力することができます。

文字を入力

しかし、隠す領域が広い場合などはテキストボックス内の文字位置の調整が
複雑になりますので、この方法はあくまでも狭い範囲を隠して文字を入力する場合に使用して、隠す領域が広い場合は、
従来通り修正テープとテキストボックスを併用するのが良いかと思われます。

是非一度お試しください。

投票をお願いいたします

アウトライナー
PDFを解析してしおり・目次を自動生成

瞬簡PDF 書けまっせ 2024
PDFに文字が書ける！入力欄を自動認識

知っておきたい便利なコワザ機能－その２－

『書けまっせPDF』の知っておくと便利な機能を4回に分けて紹介していますが、今回、第2回目は「オブジェクト一覧」ペインを紹介します。

ページが複数あるPDFを編集する場合、各ページにテキストボックスや画像など様々なオブジェクトを挿入することになります。
しかし、編集途中で挿入したオブジェクトを修正したり、削除する場合、
オブジェクトを挿入したページまでスクロールして戻らなければならず、
大量のページがあるファイルなどでは若干面倒に感じます。

そんな時は「オブジェクト一覧」ペインが便利です。
「表示」メニューから「オブジェクト一覧ペイン」を選択すると
画面下部にオブジェクト一覧ペインが表示されます。

表示メニューから選択

挿入したオブジェクトがページ毎に分かれて表示されます。
修正したいページの該当するオブジェクトをクリックするだけで
そのページに移動してオブジェクトが選択されますので、
すぐに修正や削除といった作業を行うことができます。

オブジェクト一覧ペイン

また、作成日付を指定してオブジェクトの検索を行ったり、
テキストボックスだけ、楕円だけといった
オブジェクトの属性を指定しての検索も可能です。

是非一度お試しください。

投票をお願いいたします

HTML on Word
WebページをWordで作る！

瞬簡PDF 変換 2024
PDFをOffice文書へ高精度変換

PDF/Aの作成方法(準拠レベルA)

今回は、PDF/A仕様に完全準拠となる準拠レベルAファイルの作成方法を紹介します。

前回記載しましたように、準拠レベルAでは元のドキュメントの論理構造を格納する必要があります。このため、仮想プリンタドライバでは準拠レベルA対応のファイルは作成できませんでした。
Microsoft Office のWord,Excel,PowerPointなどのPDF出力機能では、Officeのドキュメント内の情報から、準拠レベルAに対応したPDF/Aファイルを作成することができます。

●Microsoft Office

Microsoft Office 2010/2013のWord、Excel、PowerPointなどでは、直接PDFを作成することができます。このダイアログ内で「ISO 19005-1に準拠(PDF/A)」というチェックボックスがあり、これを指定することで、PDF/A-1ファイルが作成されます。

Microsoft Word 2013のPDF保存用のオプション指定ダイアログ

明確な記載を見つけることができませんでしたが、「アクセシビリティ用のドキュメント構造タグ」チェックボックスをチェックするとPDF/A-1a、チェックをはずすとPDF/A-1bファイルとなるようです。

●Microsoft用PDFMaker

アドビシステムズのAcrobat XIをインストールすると、Microsoft OfficeのWord、Excel、PowerPointなどにPDFMakerというPDF作成用のアドインプログラムが組み込まれます。これを使用すると、仮想プリンタドライバのAdobe PDFでは作成できなかった準拠レベルA対応のPDF/Aファイルを作成することができます。

Microsoft Wordに組み込まれるPDFMakerの設定ダイアログ

こちらでは、PDF/A-2a、PDF/A-2b、PDF/A-3a、PDF/A-3bも作成可能になっています。PDFMakerには「ソースファイルを添付」として、元のWord文書をPDF内に格納する指定があります。以前紹介しましたように、PDF/A-3では、ファイル内に他形式のファイルの格納を認めており、PDF/A-3選択時には、このチェックボックスを指定して、元文書をPDF/Aファイルに添付することができます(PDF/A-1では添付ファイルは禁止、PDF/A-2ではPDF/A以外の添付ファイルは禁止されているため、このチェックボックスはグレーアウトし、指定することができません）。この箇所が、PDF/A-2とPDF/A-3の大きな違いと言えます。

当社製品では以下の製品がPDF/A-1aの出力をサポートしています。
・Antenna House Formatter V6

今回紹介した製品にはレベルUの出力を指定できるものがありません。レベルUはレベルBの仕様に、出力される文字とUnicodeの対応付けをPDF内に格納することを追加したものですが、仮想プリンタドライバ、Officeなどからの直接出力のいずれの場合でも、レベルBを指定しても、この対応付けはPDF内に含めて出力されています。

以上、PDF/Aファイルの作成方法をいくつかまとめてみました。

投票をお願いいたします

瞬簡PDF 変換 2024
PDFをOffice文書へ高精度変換

HTML on Word
WebページをWordで作る！

PDF/Aの作成方法(準拠レベルB)

これまでに、PDF/A(ISO 19005)ファミリの仕様を順次紹介してきました。
PDF/A-3については、前回の紹介時点(2012/05/09～2012/05/11)ではまだ国際標準になっておらず、Draftの仕様で記載しましたが、その後、2012/10に正式に初版が発行されています。

今回はそのPDF/Aファイルの作成方法について書いてみます。

以前、説明しましたように、PDF/Aファミリには準拠レベルが存在します。長期間に渡ってファイルの視覚的な外観を維持できることを目的とするレベルB、これに加えて、ドキュメントの論理構造、意味といった情報を格納できるPDF/A仕様完全準拠のレベルAがあります(PDF/A-2,PDF/A-3ではこの中間にあたるレベルUが定義されます)

今日は、Pドキュメントの論理構造を必要としない準拠レベルB対応ファイルの作成方法を紹介します。

PDFファイルの作成方法として、アプリケーションからの印刷時に指定するプリンタにPDF出力用の仮想プリンタドライバを指定する方法、PostScriptファイルからPDFへ変換する方法などがあります。

前者では、PDF/A出力に対応している仮想プリンタドライバを指定することでPDF/Aファイルを作成することができます。プリンタドライバが、渡された印刷データからPDF/Aファイルを作成しますが、印刷データには元のドキュメントの論理構造に関する情報は含まれていないため、レベルAに準拠したPDF/Aファイルの作成はできません。PostScriptファイルからの場合も同様です。

■仮想プリンタを使用してPDF/Aファイルを作成する方法

PDF/A対応の仮想プリンタの例として、当社のAntenna House PDF Driver,アドビシステムズのAdobe PDFの使用方法です。いずれもPDF/A-1bファイルの作成に対応しています。

●Antenna House PDF Driver

これは、瞬簡PDF作成6,瞬簡PDF編集4、および瞬簡PDF 統合版6に同梱されているAntenna House PDF Driver です。
現在では、ひとつ前のバージョンになっていますが、以前の記事で、使用方法を説明しておりますので、参照ください。

●Adobe PDF

こちらは、アドビシステムズのAcrobat 製品に含まれる仮想プリンタドライバです。

アプリケーションの印刷で表示される印刷ダイアログのプリンタの選択で、Adobe PDFを選択し、詳細設定をクリックして、印刷設定ダイアログを表示します。
印刷設定ダイアログの「PDF設定」で、PDF/A-1b:2005(RGB)（CMYKカラースペースを使用する場合は PDF/A-1b:2005(CMYK)）を選択します

この「PDF/A-1b:2005(RGB)」は、Adobe PDFで設定可能な各種項目に対して、PDF/A-1b出力用に適切な値を定義したプリセットになります。「PDF設定」の右側の「編集」ボタンをクリックすると、プリセット値の内容を参照することができますが、設定内容を見てみると、「互換性のある形式」として、PDF/A-1bのベースである「PDF 1.4」、フォントには「すべてのフォントを埋め込む」、カラーマネージメントポリシーには、「すべてsRGB色に変換」、準拠する規格には、「PDF/A1-b(Acrobat 5.0互換)」などが設定されていることがわかります。
以上を指定して、印刷処理を行うことで、PDF/A-1bに準拠したPDFファイルが作成されます。フォントによっては埋め込みを禁止しているものが存在しますので、ドキュメント内でこのようなフォントが使用されていると、エラーが発生します。このような場合は、フォントの変更などドキュメント側の修正が必要となります。

■PostScriptからPDFへ変換する方法

PostScriptファイルから、PDF/A-1bファイルへの変換は Acrobatに付属するDistillerを使用することができます。また、フリーソフトとして配布されているGhostscriptもPostScriptからPDFへの変換機能を持っていますが、変換時に -dPDFAオプションを指定することで、PDF/A-1bファイルを作成することができます。

このほか、当社製品では以下の製品がPDF/A-1bの出力をサポートしています。