カテゴリー別アーカイブ: PDF活用

瞬簡PDF 変換の便利機能 -その2-

『瞬簡PDF 変換』の変換以外の機能を紹介していますが、
今回、第2回目は「テキストの抽出」機能です。

PDFファイルに入っている文字だけを再利用したい。
そんな場合に便利なのが『瞬簡PDF 変換』の抽出機能です。

抽出元となるPDFが、テキスト情報が格納されているPDFの場合、
『瞬簡PDF 変換』の操作画面の上部に並んでいるアイコンから
「抽出」のアイコンを選択すると、
画面中央の抽出ファイルに「テキストを抽出(.txt)」が
選択できるようになります。

テキストの抽出

テキストの抽出

この状態で「実行」ボタンをクリックすると
PDF内に格納されているテキストデータのみを取り出して
テキストファイルとして出力することができます。

また、スキャナなどで作成した、画像データのみが格納され
文字情報が入っていないPDFの場合は、
『瞬簡PDF 変換』の操作画面の上部に並んでいるアイコンから
「OCR」のアイコンを選択してください。

OCRを使ったテキストの抽出

OCRを使ったテキストの抽出

すると、画面中央の抽出ファイルに「OCR結果をテキストとして出力(.txt)」が
選択できるようになりますので、選択して実行を行うと、
OCRがPDF内の画像を読み取り、読み取った結果の文字を
テキストファイルとして出力します。

なお、抽出前に設定を行うことで、抽出するテキストファイルの
文字コードも指定可能となっています。

是非一度お試しください。




瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品!


アウトライナー
PDFを解析して しおり・目次を自動生成

瞬簡PDF 変換の便利機能 -その1-

PDFファイルをOfficeファイルに変換する『瞬簡PDF 変換』ですが、
実はOfficeファイルへの変換以外にも便利な機能を搭載しています。
そんな機能を3回に分けて紹介していきたいと思います。
第1回目となる今回は「OCR結果をPDFファイルに埋め込む」機能です。

OCR機能を搭載していないスキャナで紙の原稿を取り込みPDF化すると、
画像データのみが格納されたPDFが作成されます。
このようなPDFファイルは内部に文字情報が入っていないため
ファイル内の文字検索を行うことができません。
しかし、そんなPDFでも『瞬簡PDF 変換』を使用して
PDF内に透明テキストを埋め込むことで、
文字検索が可能なPDFにすることができます。

『瞬簡PDF 変換』の操作画面には、
画面上部に変換先を選択するアイコンが並んでいます。
その中にある「OCR」のアイコンを選択すると
画面中央の変換形式に「OCR結果をPDFファイルに埋め込む(.pdf)」が
選択できるようになります。

透明テキスト付きPDFの作成

透明テキスト付きPDFの作成

この状態で「実行」ボタンをクリックすると
OCRがPDF内の画像を読み取り、読み取った結果の文字をPDF内に
透明テキストとして埋め込んで出力します。

簡単な操作で、より使いやすいPDFファイルが作成できるので
是非一度お試しください。




瞬簡PDF 編集 2024
かんたん操作でPDFを自由自在に編集


瞬簡PDF 作成 2024
ドラッグ&ドロップでPDF作成

PDFの色指定について(2)

前回、PDFのデバイスカラースペースの3種類について説明しました。これらはその名前にある通りデバイスに依存したカラーの表現方法でした。そのため同じRGB値、あるいはCMYK値でも、デバイスが異なると違って見えることになります。同じ写真を2つの違うプリンタで印刷したり、同じ番組を違うテレビで見たり、といった身近なところでも経験することが多いかと思います。PDFの場合にあてはめれば、何か文書を作成してPDF化し、他の人にそのPDFを送って参照してもらうような場合に、作成した人が見ている画面と、送った先の人が見ている画面(あるいは印刷した紙)では別の色が表示されている、という現象になります。

このあたりを解決する、つまり異なるデバイス間で、同じカラー指定に対して同じ出力を行うことを目的としたカラースペースがCIEベースのカラースペースとなります。同じ出力といっても、当然ながら「そのデバイスの制限範囲内で」という制限がつきます。ディスプレイにしてもプリンタにしても、デバイスによって可能な色の再現範囲は異なりますので、その中で、指定に近い出力を得る(カラー値やカラースペースをどう調整しても、モノクロプリンタでカラー写真を印刷はできませんし)ことが目標となります。

前回記載したPDFで定義されている CIEベースカラースペース として、CalGray、CalRGB、Labおよび ICCBased の4種類を記載しました。これらのカラースペースの内容、指定されたカラー値を再現する方法の説明となるわけですが、PDFの仕様以前に、色とは何か、という非常にやっかいな説明が必要となってしまいます。わかる範囲で少し説明を試みてみたいと思います(デバイスカラースペースは、光の3原色、あるいは、プリンタのインクというような身近なところから、なんとなく理解できそうなので、色とは、などという説明抜きでなんとなく説明できましたが)。

おおざっぱにいえば、なんらかの光源から発した光が、物体にあたって反射し、人間の目に入り、人間がその物体の色として認識する、ということになります。赤いクルマといっても、太陽光の下で見る場合と、トンネル中の証明で見る場合と違うのは光源の発する光の性質が異なっていることによります。この光ですが、波としての性質を持つ、空中を伝わる振動エネルギーの束と考えることができるようです。波の性質として波長がありますが、高エネルギーの光の波長は短く(たとえば、X線では 1nm)、低エネルギーの光の波長は長く(ラジオの中波は100m~1km)なります。人間の目がとらえることができる可視光の波長は380nm~700nmのきわめて狭い領域ですが、この短波長側の光を紫、長波長側の光を赤として認識します。その外側がそれぞれ紫外線、赤外線と呼んだりします。また、虹などでは紫から赤までを適当に区切って7色と数えたりします。太陽光のような実際の光はいろいろな波長が混在した光です。可視光内で、緑の波長(国際照明委員会の規定では546.1nmだそうです)が多く含まれていれば緑、各波長の光が均等に含まれていると白と認識します。

ちょっと先走って、人間が赤とか紫とか認識すると書きましたが、人の目に入ってきた光は角膜、水晶体を通過して網膜にあたります。網膜上には光に反応する受容体として桿体、錐体というものが存在します。この錐体に可視光内の長波長(赤)に反応するもの、中波長(緑)に反応するもの、短波長(青)に反応するものがあり、それぞれの錐体がどのくらい反応するかで光の色を認識することになります。

色の話になってしまって、PDFのCIEベースカラースペースの話まで進めませんでした。こういう色というものをコンピュータ上でどう表現するか、さらにPDFではどう表現するか、また続きを記載したいと思います。

PDFの色指定について
PDFの色指定の概要・デバイスカラースペース
PDFの色指定 (3)CIE1931 CIELuv CIELAB
CIEカラースペース
PDFの色指定(4)
ICCプロファイル
PDEの色指定(5)CIEベースカラースペース
PDFのCIEベースカラースペース格納形式と使用のされ方の概略



瞬簡PDF 編集 2024
かんたん操作でPDFを自由自在に編集


瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品!

PDFの色指定について

これまで、PDFの関連仕様としてPDF/X,PDF/A などについて説明してきました。これらの各仕様の中には「カラーの再現性を保証」するために、PDFがサポートする各種カラースペースに対して制限を設けているものがありました。たとえば、PDF/X-1およびPDF/X-1aでは、使用できるカラースペースをCMYK(およびグレースケール)に限定しています。今回からPDFで使用できる色について、説明してみたいと思います。

PDFのカラー機能
まずPDFのカラー機能ですが、色を指定する機能と色を描画する機能に分けられます。
色を指定する機能
ページコンテンツの文字、線、画像、あるいは、ページコンテンツ以外のしおり、注釈といった各種オブジェクトに対して色を指定する機能になります。
色を描画する機能
色の変換やガンマ補正などを行ってPDF内に指定されている色を表示する機能です。

PDFの作成者側では、PDF内の各種オブジェクトに対して色を指定し、PDFの表示・印刷などの使用者側では、指定された色を解釈し、対象のデバイスで使用可能な機能を用いて指定された色を再現することになります。PDFの色指定には様々な方法が用意されています。表示する特定のデバイスに依存しない方法で色を指定することもできます。

PDFのカラー指定
次にPDFでカラーを指定する方法を見ていきたいと思います。
カラー値
PDF内での色の指定方法は各種存在しますが、通常、カラースペースを指定し、カラースペースによって決まるカラー成分毎に値を指定することになります。たとえば、RGBカラースペースであればカラー成分はR,G,Bの3成分を持ちますので、カラースペースとしてRGBを指定したのち、これらの各成分に対応する3種類の値を指定することになります。
カラースペース
PDFで使用されるカラースペースの説明に入ります。PDFのカラースペースは大きく3種類のカテゴリに分類されます。

  • デバイスカラースペース
    • DeviceGray
    • DeviceRGB
    • DeviceCMYK
  • CIEベースカラースペース
    • CalGray
    • CalRGB
    • Lab
    • ICCBased
  • 特殊カラースペース
    • Pattern
    • Indexed
    • Separation
    • DeviceN
デバイスカラースペース
出力デバイス上の表現に直接関係するカラー値を指定します。一番簡単な指定方法ですが、同じ指定をしても出力デバイスが異なれば違った色に見えることが多いという欠点もあります。

  • DeviceGray
    無彩色の光の輝度を白と黒の比率で制御します。カラー値の成分は1つであり、黒 0 ~白 1の範囲で表現されます。
  • DeviceRGB
    加法混色の3原色 赤・緑・青(R,G,B)を成分に持ち、各成分の値を 0(成分無)~1(最大輝度)で表現します。黒(0,0,0) ~白(1,1,1)となります。
  • DeviceCMYK
    減法混色の4原色 シアン、マゼンタ、イエロー、ブラック (C/M/Y/K)を成分に持ち、各成分の値を0(その成分無)から1(最大濃度)で表現します。白(0,0,0,0)から黒(1,1,1,0) となります。成分Kは、理論的には不要ですが、CMYのインクを混合して黒を生成するより黒インクを使用するほうが印刷上、きれいな黒が表現されるために使用されます。(0,0,0,1)も黒となります。

PDF内で、各カラースペースを混在して指定することができます。たとえば黒でABCと3文字表示されていても「A」はDeviceGrayの0、「B」はDeviceRGBの(0,0,0)、「C」はDeviceCMYKの(1,1,1,0)という場合もあり得ます。(PDF/XやPDF/Aではこのあたりの混在使用を禁止しています)

次回、CIEベースカラースペースについて説明したいと思います。

PDFの色指定について(2)
色とは何か
PDFの色指定 (3)CIE1931 CIELuv CIELAB
CIEカラースペース
PDFの色指定(4)
ICCプロファイル
PDEの色指定(5)CIEベースカラースペース
PDFのCIEベースカラースペース格納形式と使用のされ方の概略



瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品!


瞬簡PDF 作成 2024
ドラッグ&ドロップでPDF作成

IE用アドオンでWebを簡単にPDFへ

昨年末に発売した『瞬簡PDF 作成 7』、『瞬簡PDF 編集 5』に同梱されている「Antenna House PDF Driver 6.0」には、Internet Explorer 用のアドオンを追加しました。
このアドオンは、Internet ExplorerのツールバーにPDF変換ボタンを追加し、見ているWebページをワンクリックですぐにPDF化できるようにするものです。

簡単にWebページをPDFに保存できるので、ぜひともご活用ください。

IE用アドオンボタンで、見ているWebページをすぐさまPDFに変換!

IE用アドオンボタンで、見ているWebページをすぐさまPDFに変換!

TIPS:

通常、IEの「印刷」からのPDF変換は、URLをもとにしたファイル名のPDFを作成します。
IEのアドオンからのPDF変換の場合、WebページのタイトルがPDFのファイル名になって保存されますので、ファイル名を変更しなくてもわかりやすい名前で保存できて便利です。
※ファイル名で利用できない記号は「_」(アンダーバー)に置き換えて出力します。

ニュースリリース一覧

WebページのタイトルがPDFファイル名になります

利用例:

1.)申し込み完了時の申し込み番号や、Web明細などの記録

Webでコンサートや映画のチケットなどを購入した場合に、最後に申し込み番号などが表示されることがあります。「このページを印刷して保存してください。」と表示されることもしばしば。
こんな時、印刷する代わりにPDFに保存しておけば、いちいち印刷する必要がなくなります。

2.)気になった記事の記録や残しておきたい情報の記録

Webの情報は一期一会。参考になる記事や残しておきたい情報を、ブックマークしておいたりしても、ページがなくなっていたり、新しい情報に置き換わっていて、その時の情報にたどり着けないこともあります。
そんなことがないように、気になるページはワンクリックでPDFにして残しておきましょう。

3.)あとで読む

ネットで見かけた面白そうな記事をあとで読みたい。それを実現するWebサービスもありますが、PDFにしてあとで読むのもお勧めです。PDFの出力先を「DropBox」や「Skydrive」などのストレージ型クラウドサービスの同期フォルダに指定しておけば、ワンクリックでPDF化 ⇒ クラウドにアップ が完了します。
PDFにするとなにが便利か?、、、それはあらかじめクラウドからPDFをダウンロードしておけば、インターネットに繋がらない環境でもオフラインで見ることができます。

たとえば、自宅のPCで気になる記事をPDF化し、DropBoxに同期します。
それを出掛ける前にiPadなどにダウンロードしておけば、電車やバスの移動中にインターネットにつながらなくても見ることができます。

4.)ブログを残す

Webサービスバブルの到来か、最近はWebサービスが終了する話題もちょくちょく耳にするようになりました。自分の使っているブログサービスもいつかは、、、と考えると、ちょっと怖いですね。
たいていの場合は、何らかの形式で書き出しができたり、別のブログサービスに取り込みができるようになっているとは思いますが、たくさんの思い出を失わないようにPDFにして保存しておくのもよいかもしれません。

この機能がある製品はこちら

『瞬簡PDF 作成 7 』製品案内
『瞬簡PDF 編集 5 』製品案内
上記2製品を含んだ統合製品
『瞬簡PDF 統合版 7 』製品案内

ご注意

Windows 7でInternet Explorerのバージョン10(IE10)以降を利用して、WebページをPDF作成にした場合、PDF上の文字を選択したり検索できなくなります。

この現象はWindows 7でInternet Explorerを10以上にした場合などに適用される、Windowsの更新プログラム 2670838 が影響していることを確認しています。この更新プログラムが適用されている場合、IE10/11から出力されるPDFの文字列はアウトライン化され、文字情報がなくなります。
これは、他の仮想プリンタードライバー方式のPDF作成ソフトでも、同様の現象を確認しています。

このような場合は、Internet Explorer以外のWebブラウザをご利用いただくことになります。

なお、Windows 8.1/8 では問題なく文字列としてPDFを出力することができます。




瞬簡PDF 編集 2024
かんたん操作でPDFを自由自在に編集


瞬簡PDF 変換 2024
PDFをOffice文書へ高精度変換

瞬簡PDF 編集 5 の新しくなったポイント

瞬簡PDF 編集 5 パッケージ

瞬簡PDF 編集 5 パッケージ

ちょっと間が空いてしまいましたが、本日は昨年の11月末に新発売しました『瞬簡PDF 編集 5』の新しくなったポイントについてご紹介します。

『瞬簡PDF 編集 5』は、ページイメージ(縮小画像)を確認しながら簡単にPDFの結合や、ページ組み換えなどができる、PDF編集ソフトウェアです。
また、PDFを作成することができるPDF変換ドライバを同梱しています。さまざまな文書ファイルをPDFに変換して取り込み、ページ編集や組み換えなどを行って、ひとつのPDFファイルとして完成させる機能が充実しています。

『瞬簡PDF 編集 5』の新しくなったポイント

編集ビューアの単独起動で、追記/注釈がより手軽にできるようになりました。

今まで、瞬簡PDF 編集のメイン画面からしか編集ビューアを起動することができませんでしたが、編集用ビューアを単独で起動して、追記、捺印、ページ番号追加、透かし、ノート注釈、タイプライター、マーカー、図形注釈、リンク注釈などをPDFに追加して保存できるので、編集が手軽になりました。
製品のインストール時に、デスクトップ上に編集ビューアのショートカットアイコンを作成しますので、これをダブルクリックしたり、編集したいPDFをショートカットアイコンにドロップして起動/表示できます。
単独起動でPDFの編集が手軽になった編集ビューア

編集用ビューアで直接しおりの編集ができるようになりました。また、しおりをクリックしてページ移動に対応しました。

今まで瞬簡PDF 編集 のメイン画面から、しおり編集ツールを起動してしおりの追加編集を行いましたが、編集ビューアにしおり機能をつけたので、しおりの追加編集も編集ビューアを直接起動して行うことができるようになり、こちらも手軽に編集できます。
編集ビューアでしおりの編集

データ管理や処理の最適化で動作速度が速くなりました。また、より速く起動/終了処理ができるように、終了時に編集データを削除するオプションを追加しました。

データの管理や処理の方法を見直し、起動、終了、PDFの表示、PDFの保存、PDFのレイアウト保存など、各種動作が速くなりました。特にページ数の多いファイルで、前バージョンより速くなっていることが体感できると思います。
また、お客様よりご要望いただいていました、アプリケーションの終了時に編集作業のデータを残さないオプション設定ができるようになりました。

サムネイルを拡大表示する「プレビュー」機能を追加しました。内容を確認しながらのページ入れ替えなどの操作に便利です。

ページのサムネイルをダブルクリックすることで、サムネイルを別ウィンドウで大きく表示できるようになりました。似たような構成の文書の場合、小さなサムネイルでは判別しづらい場面もありましたが、拡大することで間違えることなくページの入れ替えや削除などの作業を行うことができます。

Webブラウザ「Internet Explorer」用のPDF作成アドオン機能を用意しました。

見ているWebページを、ボタンクリックですぐさまPDFに出力します。
IE用アドオンボタンで簡単PDF作成

『瞬簡PDF 編集 5 』製品案内




アウトライナー
PDFを解析して しおり・目次を自動生成


瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識

「書けまっせPDF5」で確定申告!その(1)

この時期になるとそろそろ確定申告の心配をされる方もおられるのではないでしょうか?
この稿では、「書けまっせPDF5」を使って確定申告書へ記入される場合の便利な機能についてお伝えします。

住所、氏名、生年月日

確定申告書でまず初めに記入するところは、住所、氏名、生年月日などの欄ですね。
ここでは、「確定申告書A」を例にとって説明します。

確定申告書の特長は数字を入れる欄が1字ごとの枠になっていることです。このため、それぞれにテキストボックスを作成して数字を入れていくのでは、かなり手間がかかってしまいます。
その場合は、「書けまっせPDF5」の桁割り機能がとても便利です。

桁割り機能については、本ブログの以前の記事『「書けまっせPDF」定番の便利機能(2/3)― 桁割とは?』でもご紹介しましたので、ご記憶の方も多いかと思います。

ここでは、申告書の郵便番号欄を例にとって簡単に説明します。詳細については上記記事をご参照ください。

  1. 初めに、親番号の欄を囲む形でテキストボックスを作成して、3桁の数字を入力します。
    郵便番号

    郵便番号

  2. 次に、テキストボックス・プロパティで「自動フォントサイズ」にチェックをつけます。これで、枠の大きさに合わせて自動的に数字のサイズを変更することができます。
    自動フォントサイズ

    自動フォントサイズ

  3. 最後に、同じくテキストボックス・プロパティで「桁割り」の欄を指定し、桁数を”3″に変更します。これで、3桁の郵便番号欄に数字をきれいに配置できます。
    自動フォントサイズ②

    自動フォントサイズ②

同様の手順で残りの郵便番号、住所、氏名、生年月日と、ついでに印鑑も入れてみましょう。
できあがりは、こんな感じです。

住所、氏名、生年月日

住所、氏名、生年月日

いかがでしょうか?

ここまでで使用した「書けまっせPDF5」の機能は、以下の4つになります。

  • テキストボックスの作成
  • 自動フォントサイズの指定
  • 桁割りの指定
  • 印鑑の作成

慣れないうちは思い通りに行かなくてイライラしてしまうこともあるかも知れませんが、同じことの繰り返しですので、まずは「習うより慣れろ」でやってみてください。

明日は、金額欄に挑戦してみましょう。

※「書けまっせPDF5」は弊社オンラインショップ からご購入いただけます。「書けまっせPDF5」の詳細は製品の紹介サイトをご覧ください。




瞬簡PDF 変換 2024
PDFをOffice文書へ高精度変換


HTML on Word
WebページをWordで作る!

PDF/A-1aのタグの見方

今回は PDF/Aの作成方法(準拠レベルA) でAcrobat/Wordが出力したPDF/A-1aの内容、主にタグ部分について少し見てみたいと思います。
レベルAではレベルBが持たない情報である文書の論理構造、言語などの情報を持つ必要がありました。PDFでは、文書の論理構造を表現するためにタグと呼ばれる仕組みを用意しています。
このあたりをつかって元文書がどのように表現されているか、Wordで簡単なサンプル文書を作成して、PDF/A-1aに変換したものを見てみます。

Word文書

Word文書

章、節、項の部分はWordの組み込みスタイルである「見出し1」~「見出し3」を使用し、
リスト番号を付加したものです。他に、箇条書き、表、画像 などを入れてみました。

Acrobat XIでは 「表示メニュー」の「表示切り替え」-「ナビゲーションパネル」-「タグ」とすることで、ドキュメント内につけられているタグの様子を見ることができます。左側にタグが階層表示され、ここをクリックすると本文内の対応する箇所がハイライト表示されます。
Word 2013で「PDF/A」および「アクセシビリティ用のドキュメント構造タグ」を指定して作成したPDFの場合
PDFの場合
このように表示されます。

一方、Word 2013から Acrobat XIのWord用PDFMakerでPDF/A-1aを指定して作成したPDFの場合
2013-12-06-03
となりました。

主なところだけ展開したキャプチャです。似たような構造ですが、タグの名前をはじめとして、細部では若干タグのつけ方も異なっていることがわかります。

PDFMakerでは「見出し1」など、Wordのスタイル名をそのままタグ名に使用しています。これら独自のタグ名をPDF仕様が用意している標準的なタグ名に割り当てる「ロールマップ」という仕組みがPDFに用意されていて、Acrobatでも表示させることができます。
ロールマップ

これを参照すると、スタイル名の「見出し1」を標準タグの「H1」に対応づけていることがわかります。

このような形でタグを使用して元文書の論理構造をPDFで表現します。

また、比較のために、Wordの「見出し1」などのスタイルを使わずに、表示だけ似たような形の文書を作成してPDF/A-1a出力してみます。
スタイルを使わない場合
ここの 章番号 1. 、1.1.1 などはWordのリスト番号ではなく、通常のテキスト入力したものです。
PDF/A-1aに変換した結果のタグを見てみます。
結果
これはWordのPDF保存の場合ですが、このように、こちらでは文書構造を取得するヒントとなるものが存在しないため、単純に〈P〉タグだけで出力されていることがわかります。

以上、簡単なタグ付け内容の参照方法となります。




瞬簡PDF 変換 2024
PDFをOffice文書へ高精度変換


瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識

『瞬簡PDF 作成 7』の便利な新機能

瞬簡PDF 作成 7 の便利な新機能

先週発表した『瞬簡PDF 作成 7』は新しい機能として次の実装をしました。

  • TWAIN対応のイメージスキャナーからの取り込みに対応
  • 画像ファイルを回転してPDF作成
  • IE用のアドインボタンからPDF作成
  • PDFの一括回転

これらは日ごろお客様から寄せられた、お問い合わせやご要望などを参考にさせていただき追加した機能です。一見地味な機能のように思われるかもしれませんが、実際にご利用いただいているなかから出てきた貴重なご意見は、あると便利なものも多いと思います。

「画像ファイルを回転してPDF作成」「PDFの一括回転」についてはそれぞれ「画像ファイルのPDF変換時のオプション」、「各処理後の出力PDFへの出力オプション」といったオプションとして設定するものとなります。メインの機能としての実装ではないため若干設定箇所がわかりにくいかもしれません。

新機能について利用方法や設定方法についてまとめたページを用意しましたので、ご参考になれば幸いです。

『瞬簡PDF 作成 7』新しい機能




瞬簡PDF 作成 2024
ドラッグ&ドロップでPDF作成


瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品!
Pages: Prev 1 2 3 ... 11 12 13 14 15 16 17 18 19 20 21 Next