日別アーカイブ: 2016年4月21日

第47回 証憑書類のスキャナ保存講座「PDF のプロパティ情報にOCR結果やその他QRから読み取った属性などを追加した場合、改ざんに当たるか?」

作成者:アンテナハウス株式会社 益田康夫
資 格:上級 文書情報管理士、簿記3級、行政書士
本ブログの記載内容は、公開日時点での法令等に基づいています。
その後の法令改定により要件が変わる可能性がありますので、最新の法令などをご確認下さい。

「PDF のプロパティ情報にOCR結果やその他QRから読み取った属性などを追加した場合、改ざんに当たるか?」

この質問は、某大手企業の文書管理コンサルタントから2015年秋に頂いたご質問でした。

質問の全文は以下のものでした。

質問内容
・PDF のプロパティ情報にOCR結果やその他QRから読み取った属性などを追加した場 合、
・当初スキャンした日次と比較して更新日時が変更される為、 これがファイルの改ざんに当たらないか心配
※目視確認時のファイルからの編集、変更を改ざんと呼ぶのであれば、目視確認前にOCRやプロパティ属性変更を行うことで対応できそうですがどのように考えたらよいでしょうか?

益田の回答は以下の通りです。

さて、ご質問の状態を分析すると次のように分解できます。

1.紙書類のスキャン:A時点          
2.スキャンした画像よりOCRやQRより情報取得
3.取得した情報をPDFの文書情報に書き込む:B時点
4.懸念点「AとBで時間が異なる」→ファイルの改ざんにあたるか?
5.質問「目視確認時のファイルからの編集、変更を改ざんと呼ぶの
     であれば目視確認前にOCRやプロパティ属性変更を行うこと
     で対応できそうですが、どのように考えたらよいか?」
益田見解)

見解:改ざんにはあたりません。

説明
・国税庁は紙の段階の改ざんと電子化文書に対する改ざんに対する担保措置を求めています。
・この度のご質問は後者の方に対してのものです。
・通達(入力を行う者等の意義)4-28 解説にあるように
『国税関係書類をスキャナで読み取って保存する際には、スキャナで読み取った画像をディスプレイに表示の上、当該画像と紙を照合し、スキャナで読み取った画像と紙とが同等であることを確認する作業が必ず伴うことから、「入力を行う者」とはスキャナで読み取った画像が紙の記載事項や色調と同等であることなどを確認した者をいう旨を明らかにしたものである。』
・この4-28から明らかのように電子化ファイル(画像)と照合しているのは紙書類となります。
・ご質問のOCRやQRから情報を取得して電子化ファイルに書き込むのは紙書類との照合に影響を与えるものではありません。それは、帳簿との相互関連性や検索キーの確保など他の要件確保が目的であり、その旨を規程や運用で明確にして社内で内部統制できていれば国税側が特段踏み込んでくる懸念はないと考えます。
・あわせて問35を念のため
『規則第3条第5項第1号では、国税関係書類に係る記録事項の入力を一定期間内に行うこととされています。これは、国税関係書類の作成又は受領からできるだけ早く電磁的記録にすることによって紙の段階における改ざんの可能性を低くし、タイムスタンプ及び訂正又は削除の履歴の確保の要件等を満たした電磁的記録については、電磁的記録における改ざんを防ぐことができるため、当該国税関係書類に係る電磁的記録の真実性を確保する目的から設けられているものです。』
 とあるのでタイムスタンプと訂正削除の履歴確保は電子化ファイルにはスキャンした当日に完了すべきです。

以上。

――【広告】――
・アンテナハウスは、中小企業皆様のペーパレス経理への挑戦をサポートします!
・「ScanSave(スキャンセーブ)」は、証憑書類のスキャナ保存の要件確保用の
安心、低価格、短期導入可能なパソコン用スタンドアロンソフトです!

 ScanSave-Lite  (ソフト単体)適時入力専用  12万円
 ScanSave  (ソフト単体)業務サイクル+適時入力   45万円
 ScanSave
適時入力導入支援パック
適時入力専用
タイムスタンプ2,000個/月+スキャナix100+導入支援付き
 38万円~
 ScanSave
業務サイクル入力導入支援パック
業務サイクル+適時入力
タイムスタンプ2,000個/月+スキャナix500+適正事務処理要件コンサルティング+導入支援付き
 100万円~

・詳しくは、 https://www.antenna.co.jp/scansave/ をご覧ください。
・問合わせは、 sis@antenna.co.jp まで


アクセスブルなPDF(第2回)

こんにちは!
本日は PDF の言語指定に関して説明します。

  1. 言語指定
    言語の指定はIETF の規格「RFC 4646」に従います。
    言語の指定は言語コードとカントリーコードからなります。 言語コードは一般的にに小文字を使用し、カントリーコードは一般的に大文字を使用しますが、 大文字/小文字は区別しません。

    文字指定の例を示します。
    en-US  英語  米国
    en-CA  英語  カナダ
    zh-CN  中国語  簡体字、中国
    zh-Hant  中国語  繁体字
    ja  日本語
    ko  韓国語
    fr  フランス語
    fr-CA  フランス語  カナダ

  2. 言語指定の箇所
    PDF 全体と、個別の要素ごとに言語を指定できます。
    各国の言語が混在している場合に対応できます。

    (1) PDF 全体の言語指定
    PDF 全体の言語指定は、ドキュメントカタログ内の Lang エントリで指定します。

    (2) 構造化要素の言語指定
    アクセスブルな PDF は構造化されており、 構造化辞書が存在します。
    構造化要素の要素辞書にLang エントリが有ります。
    このLang エントリで個々の要素の言語を指定します。

    3) 構造化要素以外のコンテンツの言語指定
    マーク付きコンテントシーケンスを使用します。Span タグ属性のLang エントリで言語を指定します。
    (例)

    BT  % テキスト開始
    	( アーノルドは ) Tj
    	/Span << /Lang (es-MX) >> 	% マーク付コンテント開始 スペイン語
    	BDC
    		(Hasta la vista.) Tj
    	EMC 	                                          % マーク付コンテント終了
    	(と言った。) Tj
    				
    ET  % テキスト終了
  3. 次回
    文字が unicode でエンコーディングされている場合は、言語指定との関係がどうなるのかを考えます。 また、PDF1.5 では、「多言語テキスト配列」が定義できますので、とりあげてみたいと思います。
    (多言語テキストの例)
    [ (en-US) (My vacation) (fr) (mes vacances) ( ) (default text) ]

今回はこれまでです。