月別アーカイブ: 2018年6月

ペーパーレス:用紙サイズの呪縛?

今日、お昼ご飯を食べに行ったときに、ネットニュースを見ていると「参議院でペーパーレス化」といった記事が上がっていました。衆議院議員に配られている紙の報告書などを電子化してペーパーレスにすることが決まったようです。

どのようなシステムで、どのような運用で行われるのか。
墨消しや電子署名、タイムスタンプ、はたまたブロックチェーンなどを使っているのか、興味が湧くところです。

ペーパーレスといえば以前に「モバイルファーストな文書」という記事を投稿したのですが、Wordなどの文書作成ソフトにはモバイル端末に適した表示サイズのテンプレートや仕組みがありません。今どきはスマホのように小さな画面からパソコンのようい大きな画面、縦長、横長など様々な画面があるため、これらに最適に対応するにはレスポンシブに表示される必要がありますが、紙に印刷するための用紙サイズが前提になっています。
ですので、ペーパーレスといっても、メールで送られてくる文書はA4サイズが多いです。
場合によっては見積書などは紙に印刷したものをスキャンしてPDFにして添付されてくることもあります。

紙に印刷するコストの削減や資源の節約、郵送にかかるか各種費用の削減という意味では効果がありますが、用紙サイズの呪縛があるために、印刷したくなる、あるいは印刷せざるを得ないといったことになるかもしれません。

用紙サイズの概念がなくなれば、あるいはWebサービスで共通の文書フォーマットや共通で情報を参照できる仕組みができれば、もっとペーパーレス化は進むのではないでしょうか。

ただし、この用紙サイズの呪縛のおかげでPDFはまだ当分の間は需要がありそうです。


『瞬簡PDF 編集 7』墨消し活用法(2)

昨日の続きで「墨消し」の便利な使い方を引き続き紹介していきます。

画像の特定箇所を墨消しする

画像の墨消しもやり方は同じです。「墨消し(矩形選択)」を選んで消したい部分を囲っていくだけです。画像なので「墨消し(テキスト選択)」は使えません。

(1) リボンの[ホーム]-[墨消し(矩形選択)]を選択する
(2) ビューア上で消したい部分を囲む
(3) 「PDF出力」を選択、ファイルを保存する。

墨消しした部分のデータが本当に消えたか確認してみましょう。
保存したPDFを『瞬簡PDF 編集 7』で読み直し[本文編集]を押して画像を移動させてみます。すると墨消しした部分に穴が開いてその部分のデータが完全に消えていることが分かると思います。

スキャナで取り込んだPDFなどに表示されている文字はテキストデータではなく画像になりますので墨消しする場合はこの方法で行ってください。

ページ番号を振りなおす

既存のPDFのページ番号がずれてしまってページ番号を書き直したいことがあると思います。
そんなときも墨消しが使えます。墨消しは「全ページに出力」することが可能ですのでページ番号がある部分を墨消しで覆って全ページからページ番号を消去します。あとはヘッダー・フッターで好きな位置にページ番号を入れればOKです。


(1) リボンの[ホーム]-[墨消し(矩形選択)]を選択する
(2) ビューア上でページ番号部分を囲む
(3) リボンの[オブジェクト]-[出力]で[全ページ出力]を選択する
(4) リボンの[ツール]-[ヘッダー・フッター]をクリック、フッターにページ番号を追加する
(5) 「PDF出力」を選択、ファイルを保存する。

[リンク]『瞬簡PDF編集7』のページ


『瞬簡PDF 編集 7』墨消し活用法(1)

今日は最近注目されつつある「墨消し」 これの便利な使い方を『瞬簡PDF 編集 7』を使って紹介していきたいと思います。

テキストを塗りつぶす

最もポピュラーな使い方です。テキストの隠したい部分を墨消しで塗りつぶせば、その箇所のデータをPDFファイルから完全に削除することができます。


(1) リボンの[ホーム]-[墨消し(テキスト選択)]を選択する
(2) ビューア上で消したいテキストをなぞる
(3) 「PDF出力」を選択、ファイルを保存する。

墨消しした部分のデータが本当に消えたか確認してみましょう。
ビューア上でテキストを選択してコピー、メモ帳などに貼り付けると墨消ししたテキストが消えていることが分かると思います。もちろんPDFを検索しても引っかかることはありません。

色を変えてまるごと消す

墨消しの色を用紙と同じ白色にして段落をまるごと塗りつぶせば、最初からその部分が存在しなかったかのように見せられるかもしれません。ただ空いたスペースを詰めることはできませんので、段落間が空いてしまうと不自然に思われてしまうかも。



(1) リボンの[ホーム]-[墨消し(矩形選択)]を選択する

(2) リボンの[オブジェクト]-[背景]-[塗りつぶしの色]をクリック、白色を選択する。

(3) ビューア上で消したい部分を囲む

(4) 「PDF出力」を選択、ファイルを保存する。

 

テキスト検索した結果を墨消しする

文書に含まれる特定の文字をすべて墨消ししたいという場合、検索しながら墨消しするとかなり楽に処理できます。

(1) [Ctrl]+[F]キーを押して検索文字を入力、[Enter]する。
(2) ヒットした文字が選択状態になるので、その状態で[墨消し(テキスト選択)]をクリック
(3) [F3]キー(次を検索※)を押して次の文字を検索、(2)~(3)を繰り返す。
(4) すべての文字を墨消しできたら「PDF出力」を選択、ファイルを保存する。

※墨消しをクリックすると検索位置がページ先頭に戻ってしまうので[F3]キーは何度か押す必要があります。

[リンク]『瞬簡PDF編集7』のページ


『PDF Cook Book』シリーズ PDF Tool APIを使うPDFの料理法 のご紹介

PDFの料理本『PDF CookBook』(4月発売)および『PDF CookBook第2巻』(6月発売)は、PDF Tool API V5のクラスライブラリーを使ってできるPDFの様々な加工法を紹介しています。

『PDF CookBook』
PDFのページ編集(PDFの分割・結合・ページの回転)、ページサイズ、方向および余白の変更、PDFのページにテキスト・画像・PDFを貼り付けなどを中心に解説・活用例とプログラム例を解説しています。詳細はこちらへどうぞ

出版社: アンテナハウスCAS電子出版
発売日:2018年4月
著者:アンテナハウス株式会社
販売形式:プリントオンデマンド版
サイズ:B5判 横組み
ページ数:124ページ
価格(税込):1,728円
ISBN:978-4-900552-60-9
販売店:アマゾン(POD版)(4月6日発売)、その他Web書店で発売予定

販売形式:PDF版(DRMなし)
ページ数:122ページ
価格(税込み):864円
販売店:アンテナハウス・オンラインショップ(PDFのダウンロード)

『PDF CookBook第2巻』
PDFのセキュリィティ(パスワードセキュリティ)、閲覧制限、透かし、しおりなどについて等を中心に解説・活用例とプログラム例を解説しています。詳細はこちらへどうぞ

出版社: アンテナハウスCAS電子出版
発売日:2018年6月中旬
著者:アンテナハウス株式会社
販売形式:プリントオンデマンド版
サイズ:B5判 横組み
ページ数:126ページ
価格(税込):1,728円 6月18日アマゾンで発売になりました。
ISBN:978-4-900552-61-6
販売店:アマゾン(POD版)その他Web書店で発売予定

販売形式:PDF版(DRMなし)
ページ数:126ページ
価格(税込み):864円 6月8日発売
販売店:アンテナハウス・オンラインショップ(PDFのダウンロード)※PDF版のダウンロードは自社ストアのみです。


PDFの「墨消し(墨塗り)事故」って、例の森友文書でも発生してた! まだポピュラーな問題なのでした

しばらく前から、ブログの過去記事のページビューを調べるようになりました。そうしましたら、ここ最近、2015年7月31日投稿の「PDFの墨消しは、塗りつぶすだけではだめなんです」が高い順位に上がっていました。

さほど面白い文章でもないのに、なぜなんだろう? と調べたところ、例の森友文書で起きていたんですね~ やはり奇妙な現象には原因があるのでした。墨消しがホットな話題とは!

日経と文春のWebの解説を読みました。

日経(6月13日)
森友文書でも発生、墨塗りPDFから漏洩 間違った対策

文春(6月15日)
森友文書で黒塗りしたデータが流出! なぜこんなミスが起きたのかを専門家が検証

日経の文章は理解し易いですが、文春の文章は理解しにくいです。文春の記事は編集者がチェックしていないんでしょうかね。

弊社デスクトップ製品では、『瞬簡PDF編集7』『瞬簡PDF 書けまっせ7』に、墨消し機能があります。

また、システム製品『PDF Tool API』でも墨消しができます。
現在、開発中の『PDF Tool API V6』では、検索でヒットした範囲を墨消し範囲に選択する機能が追加になります。


「MathML 数式組版入門」の大学図書館への寄贈についてのお知らせ

2017年12月から弊社では数式など数学的記述をコンピュータ上で表現するための言語 MathML(マスエムエル)の普及・啓蒙のため、数式組版を行うための入門書「MathML 数式組版入門」を全国の大学図書館に寄贈する案内を計画、問い合わせを行ってまいりました。

これまでに 456 の大学図書館へご案内を送り、199 の図書館よりご返答をいただきました。寄贈のご希望は 66 の図書館よりいただき、それぞれの図書館へ発送いたしました。ご返答いただいた図書館の 3割以上に受け入れていただき、MathML へ関心の高さを感じました。今後も情報発信など積極的な活動を行います。

「MathML 数式組版入門」の寄贈は現在も引き続き行っています。ご希望の図書館は、xml-info@antenna.co.jp までご連絡ください。

なお、本書は全文を PDF形式で無料公開もしています。是非、ご活用ください。
MathML 数式組版入門(PDF形式)

組版に使用した『AH Formatter』の評価版は以下のページよりお申し込みいただけます。また、『AH Formatter』についてお問い合わせがございましたら、弊社システム営業グループ(sis@antenna.co.jp)までお問い合わせください。
AH Formatter 評価版のお申し込み

◆ MathML の組版について

『AH Formatter』は MathML を独自開発したエンジンにより描画します。そのため、MathML が記述された FO や HTML は事前に変換する必要はなく、そのまま組版可能です。MathML の組版については、「MathML 描画エンジン」をご覧ください。

 


[AH Formatter] HTML+LaTeX から HTML+SVG への変換

HTML の中に数式が LaTeX で記述されているとき、『AH Formatter』で数式を含めて PDF 出力したいというご要望を実現するため、弊社では HTML に記述された LaTeX部分を MathJax(※)で SVG に変換して、HTML と SVG にしてから『AH Formatter』で組版することをお勧めしています。
MathJax とは、MathML・TeX・ASCIImath で記述された数式をブラウザ上でレンダリングする JavaScript エンジンです。閲覧者は数式の表示のためにブラウザにアドオンのインストールや、フォントの用意などをすることなく、数式を表示できます。

この HTML+LaTeX から HTML+SVG の変換を実現するために弊社では SlimerJS / PhantomJS用のスクリプト「mathjaxToSVG.js」をご用意しました。次のようなコマンドラインで HTML+LaTeX を HTML+SVG にすることが可能です。(推奨環境:Linux+SlimerJS+Firefox)

使用例(入力ファイル input.html、出力ファイル output.html):

$ slimerjs mathjaxToSVG.js input.html > output.html
または
$ phantomjs mathjaxToSVG.js input.html > output.html

次のように中間生成物の HTMLファイルを出力せずに、PDFを出力することも可能です。

$ slimerjs mathjaxToSVG.js input.html | AHFCmd -d @STDIN -x 3 -o output.pdf
または
$ phantomjs mathjaxToSVG.js input.html | AHFCmd -d @STDIN -x 3 -o output.pdf

◆ mathjaxToSVG.js のお問い合わせ

SlimerJS / PhantomJS用のスクリプト「mathjaxToSVG.js」をお試しご希望の方、また、『AH Formatter』についてお問い合わせがございましたら、弊社システム営業グループ(sis@antenna.co.jp)までお問い合わせください。

◆ MathML の組版

なお、MathML については『AH Formatter』は独自開発したエンジンにより描画します。そのため、MathML が記述された FO や HTML を事前に変換する必要はなく、そのまま組版可能です。MathML の組版については、「MathML 描画エンジン」をご覧ください。

 


AH Formatter 公開サンプルページのご紹介

AH Formatter』は製品ページ上にて XSL-FO の基本仕様と『AH Formatter』の拡張機能を使用したサンプル FO を多数公開しています。
サンプル FO 集

サンプルはページ領域やブロック、表といった分野ごとに項目を分けています。また、下の画像のように一覧表の左側の欄にはサンプルの組版に必要な『AH Formatter』のバージョンと『AH Formatter』の拡張機能を使用しているものには「AH拡張」と記しています。

 AH Formatter 公開サンプル

各サンプルは FO だけでなく、出力した PDF もご用意していますので出力結果をその場でご確認いただけます。
XSL-FO & AH Formatter 使いこなし技」の項目は基本仕様とは異なり、機能を組み合わせ特定の条件を回避したり実現する裏技的なサンプルです。まだまだご用意している数は少ないですが、随時追加していきます。

そのほか、要素名などのキーワードからサンプルを見つけていただけるよう「サンプルFO集 索引」ページもご用意しています。こちらのページも是非お役立てください。

 


TextPorter におまかせ その3

■ 全文検索の結果はテキスト情報だけではなく、元の文書も閲覧したいのですが、ファイル形式がバラバラでして。

『TextPorter』 は、さまざまなアプリケーションのファイルから、作成したアプリケーションがなくてもテキストを抽出することができます。
その抽出したテキストを、全文検索システムで検索できるようにしておくことで、目的の文書をすばやく探し出せるのです。

と、ドヤ顔で言ってはみましたが、確かに作成されている文書はテキスト情報だけではありません。挿絵の画像やグラフ・表は、文書の附帯情報として必須のものです。
やはり元の情報を過不足無く閲覧できるのがベストですね。
(次第に声が小さくなっていく)

テキスト以外の情報を切り出して再配置する。できないことはありませんが、手間が掛かる。
元ファイルをそのままリンクしても、各アプリケーションが無いと開けません。
ファイルを丸ごと画像や PDF に変換するにしても、やはり作成元のアプリケーションが必要。
アプリケーションに依存せずにテキストを抽出したのだから、閲覧ファイルも同じように作れたら・・・

「となると、やっぱり あれ の出番ですね」

『Office Server Document Converter(OSDC) にお任せください!』

Office Server Document Converter は、作成元のアプリケーションもプリンタドライバも必要とせずにドキュメントを変換できます。

Office Server Document Converter によって、文書からサムネイル画像を生成することで、全文検索システムで検索した文書の見分けも簡単にできるようになります。
目的の文書をすばやく探し出して、そのサムネイルをみて、実際の文書を引っ張り出せるようにするわけです。
また、検索結果と PDF をリンクすることで、元の文書の情報を過不足無く閲覧することができます。

システムのイメージは、
Office Server Document Converter 活用例にある
サムネイルサーバ
を発展させたものです。

『アンテナハウス にお任せください!』

Office Server Document Converter に関する詳しい情報は、
https://www.antenna.co.jp/sbc/
を、ご覧ください。

評価版もご用意しております。
Office Server Document Converter 評価版のお申し込み
から、お申し込みください。

<< TextPorter におまかせ その2