タグ別アーカイブ: PDF

PDFの墨消しは、塗りつぶすだけではだめなんです

書類や帳票などを外部に公開するとき、機密情報や個人のプライバシー上問題になる部分を墨で塗りつぶすことを「墨消し」(または「墨塗り」)といいます。

墨消しとか黒塗りというのは紙の時代の用語をそのまま使ってしまっていますが、紙の書類なら、墨で塗りつぶせば下の文字や画像を読むのは難しくなります。

しかし、PDFファイルを公開するときは、隠したい部分を塗りつぶしただけだとPDFファイルの中に残っている情報を取り出すことができてしまいます。

Webを検索すると、「隠したい部分を塗りつぶしたPDFを公開したところ、入手した人に塗りつぶした部分の情報が見えてしまった」という、笑えない失敗がいくつも見つかります。

墨消しや墨塗りなどという過去の方法を、PDFという現代の紙でもそのままできると考えるのが誤解のもとなのでしょう。

PDFの墨消しは単に墨で塗るだけではだめなんです。つまり、PDFでは、隠したい箇所の上を墨で塗りつぶしすのと同時に、隠したい箇所のデータをPDFファイルから削除する、つまり「完全削除」、あるいは、痕跡を残さず削除」必要があります。

これは以前から多方面のご要望をいただいています。ご安心ください。『瞬簡PDF編集6』では、PDF特有の墨消しをワンタッチで行う機能が弊社製品として初めて付きました。

墨消し機能を『瞬簡PDF編集6』でぜひお試しになってみてください。

PDF-Edit6


CAS-UBのサイトにて、PDFの総合解説書『PDFインフラストラクチャ解説』を無償配布しています。どうぞ、ご利用ください。

CAS-UBの書籍をつくる仕組みを使って制作中の『PDFインフラストラクチャ解説』を0.30版に改訂しました。

無償配布しています:CAS-UB出版物紹介ダウンロードの「PDFインフラストラクチャー解説(仮)」

PDF版とEPUB3版を用意しています。

0.30版で次の改訂を行ないました。

1.内容の追加

0.30版では第21章PDFの長期保存:21.1 PDF長期署名の節を有限会社ラング・エッジの宮地社長に執筆していただきました。

2.参考資料の形式を変更

(1) 参考資料の一覧形式を変更しました。「MLA Handbook」第7版[1]をベースとする独自方式で整理しています。

(2) また、本文から参考資料へのリンクも変更しました。従来、本文中から参考資料(Web)へ直接リンクしていましたが、これを廃止して、本文から参考資料へリンクしています。参考資料からWebへ必要に応じてリンクを設定しています。

3.PDF生成のレイアウトを変更しました。

・基本版面を変更するとともに、見出しのレイアウトを変更しました。(途中)。
・CAS-UBのPDF生成詳細設定の見出しのデフォルト・レイアウトを変更。「PDFインフラストラクチャー解説(仮)」のPDF版はデフォルト・レイアウトで生成しています。[2]

アンテナハウスのCAS-UBは、クラウド上で書籍を編集し、PDF・EPUB・Kindleなどの形式で配布出版物を制作するサービスです。30日間評価ライセンスもございますので、ぜひお試しになってみてください。

《注》
[1] “MLA Handbook for Writers of Research Papers. Seventh Edition.” New York: Modern Language Association. 2009
[2] 『PDFインフラストラクチャ解説』はCAS-UBできちんとした本(PDF、EPUB)を作るための実証材料としても利用しています。3月にBODで本を作りました(『PDFインフラストラクチャ解説』をプリントオンデマンドで本にしてみました)が、この本の組版レイアウトを専門家に評価していただき、その評価を反映して、基本版面やPDF生成の詳細設定のデフォルトを変更しています。これはまだ途中段階です。


『瞬簡PDF OCR』のマルチドキュメント・インタフェースとは?

昨日に続いて、日本語/英語活字OCR変換ソフト『瞬簡PDF OCR』をご紹介します。

『瞬簡PDF OCR』は、マルチドキュメント・インタフェースというちょっと聞き慣れない用語でその操作性をアピールしております。
これは何かといいますと、平たく言えば、いくらでもデータを読み込んでお好きな変換先に変換できますよ、ということです。

もちろんパソコンの物理的な制限というのはありますから、「いくらでも」というのは言い過ぎですね。
しかし、スキャナからでも、PDFからでも、ビットマップやJPEGなどのイメージからでも、クリップボードからでも、画像データであればとりあえず『瞬簡PDF OCR』の画面上に放り込んでおいて、いつでもWordやExcelに変換できるような作りになっています。

以下では、そのあたりを説明してみたいと思います。

『瞬簡PDF OCR』では、原稿データの1枚を「ページ」と言っています。
スキャナで紙の原稿を読み込むときの原稿1枚、1枚がそれぞれ1ページになります。
画像ファイルを読み込んだ場合はひとつの画像ファイルが1ページとなり、 PDFを読み込んだ場合はPDFに含まれる各ページがそれぞれ1ページになります。

次に、ページをひとつにまとめたものを「ドキュメント」と言います。
『瞬簡PDF OCR』では、ひとつのドキュメントが『Word』や『Excel』の1文書に変換されます。 また、作業ファイルに保存する場合も「ドキュメント」毎に行います。
これを図に表すと以下のようになります。

tutrial_pdf_ocr_s.png
(画像をクリックすると拡大します)

これをどんなふうに使うかというと、例えばスキャナで複数の原稿を取り込む場合を考えてみます。
紙の原稿にはいろいろな種類があると思いますが、報告書であるとか、申請書のような形式の文書はWordで編集した方が何かと便利です。
一方、表形式になった月次売上だとか名簿などは、Excelで編集するのが向いていると言えます。
これらを一度にスキャンして、別々のドキュメントにまとめて取り込んでおけば、片方はWordに、もう片方はExcelに分けて変換することができます。

また、Wordに変換する場合でも、報告書は報告書でまとめてひとつのWordファイルに変換し、申請書は申請書で種類毎に別のWordファイルにしたいと思いませんか?
そのような場合でも、『瞬簡PDF OCR』では、報告書のドキュメント、申請書Aのドキュメント、申請書Bのドキュメントというように、原稿を取り込んだ時点で分類しておけるので、後はそれぞれのドキュメント単位で変換できます。
これを整理しますと、以下のようになります。

  • スキャンした原稿や、PDFの内容などをひとつのドキュメントにしたり、それぞれを別のドキュメントに分けたりすることで、目的に応じた変換結果を簡単に得ることができます。
  • ドキュメントに含まれるページは、サムネイルを使って順序を入れ替えたり、不要なら削除したりが簡単に操作できます。また、ドキュメント間でページに含まれる任意の範囲をコピーして貼り付けたり、移動することも可能です。
  • ドキュメント毎にその状態を保存できますので、途中で作業を中断して『瞬簡PDF OCR』を終了しても、次回起動時に再び前回の中断時点から作業を再開することが容易です。

tutrial_main_interface_s.png
(画像をクリックすると拡大します)

以上、『瞬簡PDF OCR』の操作画面について、簡単に説明しました。
次回は実際に取り込んだ画像データから変換を行うまでの操作方法についてご紹介したいと思います。
是非明日もこちらのブログをご覧ください。

※『瞬簡PDF OCR』は製品の体験版を公開しております。『瞬簡PDF OCR』のユーザー体験を、製品紹介サイトでお試しください。


Pages: Prev 1 2 3 4