カテゴリー別アーカイブ: PDF活用

Antenna House Regression Testing System (AHRTS)
Antenna House Formatterを自動でリグレッションテストするツール

2011年にUSアンテナハウスのサポートチームはAntenna House Formatter のリリース時の社内テスト用に自動のリグレッションテストシステムの開発をスタートしました。当時はおよそ1,000程の文書(10,000ページ以上)を使ってテストを行っていましたが、数人で作業して2,3日は掛かりました。スクリーン上の目視で、正しいPDF表示との見比べを左右並べて行っていたからです。

リグレッションテストは開発やリリースの過程で重要なステップですが、時間と人手間が掛かり、目視によるためそれほど正確ではありませんでした。

リグレッションテストのプロセス自動化を行うに当たって、次の様な課題が持ち上がりました。

  • コードではなくビジュアルなPDFを比較できるツールであること。なぜならPDFの内部構造は違うかもしれないが同じように見えることが大事だから。
  • 大容量の文書をテストすることができ、どこが違うか、差異をレポートできるツールであること。
  • 従来の方法より早く処理可能なこと。

こういった要求を満たすツールを探したがなかなか見つからなかったので、独自のソリューションの開発を始めたわけです。六か月ほどして、サポートチームはPDFをビットマップに変換しページをピクセルで比較するシステムを開発しました。この初版のツールを使っていままで何日もかかっていたテストが一日でできるようになりました。次のワークフローはこのシステムの詳細な過程を示しています。このシステムを使って、PDF単体の比較や、PDFを格納してあるディレクトリ単位でもテストが可能となりました。

20140605-01

レポートは実際にはAntenna House Formatterで生成され、3つのパネルに配置されます。

20140605-02

左のパネルはベースラインから抽出したオリジナルのPDFで、右のパネルは新しい文書から抽出したPDFです。AH Formatterの機能を使って個々のページをPDFから選択して一つのPDFにマージすることも可能です。真ん中のパネルは2つのページの差異をハイライトで示したビットマップの合成です。オリジナルと新規の文書でどんな種類の違いが生じたのか特定できるよう、その差異を色別に示しています。違いを含んだページのみをレポートに含むことが重要と考え、その方針で、もし500ページ中4ページだけ差異がある場合、その4ページのみを見るだけで済むようになっています。

その後更に開発を続けパーフォーマンスは飛躍的に改良されました。ユーザーフレンドリーなGUIを立ち上げインストーラを作成し、5分以内でソフトウェアをインストールが可能になりました。また、Windowsに加えて、Linux Macにも対応しました。

現在では、このシステムを使って2時間以内でテストを終えることができ、どんな差異も見つけることができると自負しています。弊社のFormatterの定期リリースや、改訂リリースがテストのために遅延するということはなくなりました。また、この上質なテストを行うことで、品質がかなり良くなっていることが判明しました。

リグレッションテストシステムは現在Antenna Houseの商品として販売しています。詳しい情報についてはこちらをご参照ください。

http://www.antennahouse.com/antenna-house-regression-testing-system/




瞬簡PDF 作成 2024
ドラッグ&ドロップでPDF作成


瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品!

JATSをPDFに

先日、学術情報XML推進協議会さん主催のセミナーにお招きいただき、「XML自動組版を実践する」というテーマで2時間近くお話させていただく機会がありました。いつもは30分とかせいぜい1時間くらいお話しさせていただくことが多いのですが、2時間というのは相当長い時間をいただいたことになります。
ご参加者者は35名くらいだったでしょうか。お申し込みはもっとあったようですが、会場のキャパの関係で途中で受付を打ち切られたそうです。そういうお話を聞かされたらこちらも気合が入ります(笑)。

まずXMLの一般的な話題から入って、それをPDFにするための手段について話を進めます。

XMLの具体例

XML→XSL-FO→PDF

そしてXSL-FOの概要説明を経て、XSLTスタイルシートの説明。

XSL-FO の具体例

XSLTスタイルシートの例

XSLTスタイルシートの例

最後に、どうやってJATSを入力するのか、ということで今回はoXygenを使って実際に入力するところをご覧いただきました。

昨年も、学術情報XML推進協議会さんにはセミナーにお招きいただき、そのときは主にHTMLに変換するためのXSLTスタイルシートの作り方のお話をさせていただいています。
JATSに限らず、もしXMLの自動組版について話が聞きたいという方がいらっしゃいましたら、いつでもご連絡ください。お待ちしております。




瞬簡PDF 編集 2024
かんたん操作でPDFを自由自在に編集


瞬簡PDF 作成 2024
ドラッグ&ドロップでPDF作成

瞬簡PDF for Cloud とデスクトップライセンス

お問い合わせいただくこともございますが、
瞬簡PDF等の当社デスクトップ製品ライセンスは、1台のパソコンに1ライセンス必要です。
個人ユーザー様の場合、2ライセンスからは、優待価格を用意致しております。
普段、ご使用のパソコンで、当社デスクトップ製品パッケージをご使用いただいており、他のパソコンでもご使用希望の際は、是非お問い合わせください。

その際、もし必要な機能がPDFからOffice文書への変換だった場合、この度、もう一つの選択肢を用意させていただきました。
ブラウザーから変換したいPDFファイルをアップロードして、普段、ご使用のOfficeファイルへ変換。
変換結果は、e-mailアドレスへ添付ファイルで送信、あるいはストレージ型クラウドサービスへ保存可能な「瞬簡PDF for Cloud」です。

瞬簡PDF for Cloud

無償お試し期間も用意してございますので、
当社商品をご使用いただいたことがない方も是非お気軽にお試しください。




瞬簡PDF 編集 2024
かんたん操作でPDFを自由自在に編集


瞬簡PDF 変換 2024
PDFをOffice文書へ高精度変換

Web上で循環/完結できるサービスを構築に関して

本日は、先日リリースしました弊社の新サービス【瞬間PDF for Cloud】のご紹介とその周辺を補完し得る弊社ライブラリのご紹介をしたいと思います。

まず最初に新サービスとなります【瞬間PDF for Cloud】に関して、このサービスは、パッケージ版販売しております【瞬間シリーズ】の機能の一部をサービスとしてクラウド(Cloud)環境上に配置しいつでも使いたいときに/使いたい分だけご使用できるようにご用意したものです。
機能としては、PDFファイルや画像ファイルをMicrosoft Word/Excel/PowerPint 形式のファイルや一太郎(ジャストシステム社)形式、透明テキスト付PDFに変換する事ができます。
これにより、PDFファイルや画像ファイルで配布された帳票やフォームなどを慣れたアプリケーションで再利用することができます。
是非ご活用ください。

また、弊社には上記サービスよりも先発していました【書けまっせPDF for Web】というものがありました。これは、PDFをブラウザ上で表示させ、ユーザ間共有し編集できるものです。
残念ながら、現在の公開は停止しておりますが、このサービスと【瞬間PDF for Cloud】は非常に親和性が高いものと思っております。

さらに弊社では、様々な用途用にPDFを作成するライブラリを作成・販売しております。

これらを組み合わせる事によりWeb上で循環/完結できるサービスを構築することも可能ですし、既存の社内システム、及びサービスへの組み込みも可能です。
是非ご検討ください。




瞬簡PDF 変換 2024
PDFをOffice文書へ高精度変換


アウトライナー
PDFを解析して しおり・目次を自動生成

各製品の改訂情報

アンテナハウスのデスクトップ製品は、製品の出荷後に見つかった問題の修正や
機能の改善などを行った際に改訂版を公開しています。

現在、販売中の『瞬簡PDF 統合版 7』に含まれている製品の
最新バージョンと公開されているURLは次の通りです。

・書けまっせPDF 5 バージョン5.1.0
https://www.antenna.co.jp/support/update/kpd/kpd50.html#kpd510

・瞬簡PDF 変換 8 バージョン8.0.4
https://www.antenna.co.jp/support/update/pdftooffice/pdftooffice80.html#srt804

・瞬簡PDF 編集 5 バージョン5.0.1
https://www.antenna.co.jp/support/update/pdfedit/pdfedit50.html#pde501

・瞬簡PDF OCR バージョン1.0.4
https://www.antenna.co.jp/support/update/pdfocr/pdfocr10.html#ocr104

※瞬簡PDF 作成 7 については現在改訂版はございません。

お使いの製品がどのバージョンになるのか、各製品の「ヘルプ」メニューから
「バージョン情報」を表示することで確認できますので、
最新版になっているかご確認頂き、古いバージョンをお使いであれば、
上記より、各製品の最新版を入手した上で改訂版を導入してください。

また、上記以外の製品についても改訂版を公開しておりますので、
詳細は下記「デスクトップ製品 改訂情報」ページをご参照ください。

https://www.antenna.co.jp/support/update/




瞬簡PDF 作成 2024
ドラッグ&ドロップでPDF作成


瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識

瞬簡PDF 変換の便利機能 -その3-

『瞬簡PDF 変換』の変換以外の機能を紹介していますが、
今回、第3回目は「画像の抽出」機能です。

PDFファイルに入っている画像を抜き出して再利用したい。
そんな場合に便利なのが『瞬簡PDF 変換』の画像抽出機能です。

『瞬簡PDF 変換』の操作画面の上部に並んでいるアイコンから
「抽出」のアイコンを選択すると、
画面中央の抽出ファイルに「画像を抽出(.bmp/.jpg/.png)」が
選択できるようになります。

画像の抽出

画像の抽出

この状態で「実行」ボタンをクリックすると
PDF内に格納されている画像データのみを取り出して出力することができます。
また、特定のページにある画像だけを取り出したい場合、
ページを指定しての処理も可能となっています。

是非一度お試しください。




瞬簡PDF 変換 2024
PDFをOffice文書へ高精度変換


アウトライナー
PDFを解析して しおり・目次を自動生成

瞬簡PDF 変換の便利機能 -その2-

『瞬簡PDF 変換』の変換以外の機能を紹介していますが、
今回、第2回目は「テキストの抽出」機能です。

PDFファイルに入っている文字だけを再利用したい。
そんな場合に便利なのが『瞬簡PDF 変換』の抽出機能です。

抽出元となるPDFが、テキスト情報が格納されているPDFの場合、
『瞬簡PDF 変換』の操作画面の上部に並んでいるアイコンから
「抽出」のアイコンを選択すると、
画面中央の抽出ファイルに「テキストを抽出(.txt)」が
選択できるようになります。

テキストの抽出

テキストの抽出

この状態で「実行」ボタンをクリックすると
PDF内に格納されているテキストデータのみを取り出して
テキストファイルとして出力することができます。

また、スキャナなどで作成した、画像データのみが格納され
文字情報が入っていないPDFの場合は、
『瞬簡PDF 変換』の操作画面の上部に並んでいるアイコンから
「OCR」のアイコンを選択してください。

OCRを使ったテキストの抽出

OCRを使ったテキストの抽出

すると、画面中央の抽出ファイルに「OCR結果をテキストとして出力(.txt)」が
選択できるようになりますので、選択して実行を行うと、
OCRがPDF内の画像を読み取り、読み取った結果の文字を
テキストファイルとして出力します。

なお、抽出前に設定を行うことで、抽出するテキストファイルの
文字コードも指定可能となっています。

是非一度お試しください。




アウトライナー
PDFを解析して しおり・目次を自動生成


瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識

瞬簡PDF 変換の便利機能 -その1-

PDFファイルをOfficeファイルに変換する『瞬簡PDF 変換』ですが、
実はOfficeファイルへの変換以外にも便利な機能を搭載しています。
そんな機能を3回に分けて紹介していきたいと思います。
第1回目となる今回は「OCR結果をPDFファイルに埋め込む」機能です。

OCR機能を搭載していないスキャナで紙の原稿を取り込みPDF化すると、
画像データのみが格納されたPDFが作成されます。
このようなPDFファイルは内部に文字情報が入っていないため
ファイル内の文字検索を行うことができません。
しかし、そんなPDFでも『瞬簡PDF 変換』を使用して
PDF内に透明テキストを埋め込むことで、
文字検索が可能なPDFにすることができます。

『瞬簡PDF 変換』の操作画面には、
画面上部に変換先を選択するアイコンが並んでいます。
その中にある「OCR」のアイコンを選択すると
画面中央の変換形式に「OCR結果をPDFファイルに埋め込む(.pdf)」が
選択できるようになります。

透明テキスト付きPDFの作成

透明テキスト付きPDFの作成

この状態で「実行」ボタンをクリックすると
OCRがPDF内の画像を読み取り、読み取った結果の文字をPDF内に
透明テキストとして埋め込んで出力します。

簡単な操作で、より使いやすいPDFファイルが作成できるので
是非一度お試しください。




瞬簡PDF 編集 2024
かんたん操作でPDFを自由自在に編集


瞬簡PDF 作成 2024
ドラッグ&ドロップでPDF作成

PDFの色指定について(2)

前回、PDFのデバイスカラースペースの3種類について説明しました。これらはその名前にある通りデバイスに依存したカラーの表現方法でした。そのため同じRGB値、あるいはCMYK値でも、デバイスが異なると違って見えることになります。同じ写真を2つの違うプリンタで印刷したり、同じ番組を違うテレビで見たり、といった身近なところでも経験することが多いかと思います。PDFの場合にあてはめれば、何か文書を作成してPDF化し、他の人にそのPDFを送って参照してもらうような場合に、作成した人が見ている画面と、送った先の人が見ている画面(あるいは印刷した紙)では別の色が表示されている、という現象になります。

このあたりを解決する、つまり異なるデバイス間で、同じカラー指定に対して同じ出力を行うことを目的としたカラースペースがCIEベースのカラースペースとなります。同じ出力といっても、当然ながら「そのデバイスの制限範囲内で」という制限がつきます。ディスプレイにしてもプリンタにしても、デバイスによって可能な色の再現範囲は異なりますので、その中で、指定に近い出力を得る(カラー値やカラースペースをどう調整しても、モノクロプリンタでカラー写真を印刷はできませんし)ことが目標となります。

前回記載したPDFで定義されている CIEベースカラースペース として、CalGray、CalRGB、Labおよび ICCBased の4種類を記載しました。これらのカラースペースの内容、指定されたカラー値を再現する方法の説明となるわけですが、PDFの仕様以前に、色とは何か、という非常にやっかいな説明が必要となってしまいます。わかる範囲で少し説明を試みてみたいと思います(デバイスカラースペースは、光の3原色、あるいは、プリンタのインクというような身近なところから、なんとなく理解できそうなので、色とは、などという説明抜きでなんとなく説明できましたが)。

おおざっぱにいえば、なんらかの光源から発した光が、物体にあたって反射し、人間の目に入り、人間がその物体の色として認識する、ということになります。赤いクルマといっても、太陽光の下で見る場合と、トンネル中の証明で見る場合と違うのは光源の発する光の性質が異なっていることによります。この光ですが、波としての性質を持つ、空中を伝わる振動エネルギーの束と考えることができるようです。波の性質として波長がありますが、高エネルギーの光の波長は短く(たとえば、X線では 1nm)、低エネルギーの光の波長は長く(ラジオの中波は100m~1km)なります。人間の目がとらえることができる可視光の波長は380nm~700nmのきわめて狭い領域ですが、この短波長側の光を紫、長波長側の光を赤として認識します。その外側がそれぞれ紫外線、赤外線と呼んだりします。また、虹などでは紫から赤までを適当に区切って7色と数えたりします。太陽光のような実際の光はいろいろな波長が混在した光です。可視光内で、緑の波長(国際照明委員会の規定では546.1nmだそうです)が多く含まれていれば緑、各波長の光が均等に含まれていると白と認識します。

ちょっと先走って、人間が赤とか紫とか認識すると書きましたが、人の目に入ってきた光は角膜、水晶体を通過して網膜にあたります。網膜上には光に反応する受容体として桿体、錐体というものが存在します。この錐体に可視光内の長波長(赤)に反応するもの、中波長(緑)に反応するもの、短波長(青)に反応するものがあり、それぞれの錐体がどのくらい反応するかで光の色を認識することになります。

色の話になってしまって、PDFのCIEベースカラースペースの話まで進めませんでした。こういう色というものをコンピュータ上でどう表現するか、さらにPDFではどう表現するか、また続きを記載したいと思います。

PDFの色指定について
PDFの色指定の概要・デバイスカラースペース
PDFの色指定 (3)CIE1931 CIELuv CIELAB
CIEカラースペース
PDFの色指定(4)
ICCプロファイル
PDEの色指定(5)CIEベースカラースペース
PDFのCIEベースカラースペース格納形式と使用のされ方の概略



瞬簡PDF 作成 2024
ドラッグ&ドロップでPDF作成


瞬簡PDF 編集 2024
かんたん操作でPDFを自由自在に編集

PDFの色指定について

これまで、PDFの関連仕様としてPDF/X,PDF/A などについて説明してきました。これらの各仕様の中には「カラーの再現性を保証」するために、PDFがサポートする各種カラースペースに対して制限を設けているものがありました。たとえば、PDF/X-1およびPDF/X-1aでは、使用できるカラースペースをCMYK(およびグレースケール)に限定しています。今回からPDFで使用できる色について、説明してみたいと思います。

PDFのカラー機能
まずPDFのカラー機能ですが、色を指定する機能と色を描画する機能に分けられます。
色を指定する機能
ページコンテンツの文字、線、画像、あるいは、ページコンテンツ以外のしおり、注釈といった各種オブジェクトに対して色を指定する機能になります。
色を描画する機能
色の変換やガンマ補正などを行ってPDF内に指定されている色を表示する機能です。

PDFの作成者側では、PDF内の各種オブジェクトに対して色を指定し、PDFの表示・印刷などの使用者側では、指定された色を解釈し、対象のデバイスで使用可能な機能を用いて指定された色を再現することになります。PDFの色指定には様々な方法が用意されています。表示する特定のデバイスに依存しない方法で色を指定することもできます。

PDFのカラー指定
次にPDFでカラーを指定する方法を見ていきたいと思います。
カラー値
PDF内での色の指定方法は各種存在しますが、通常、カラースペースを指定し、カラースペースによって決まるカラー成分毎に値を指定することになります。たとえば、RGBカラースペースであればカラー成分はR,G,Bの3成分を持ちますので、カラースペースとしてRGBを指定したのち、これらの各成分に対応する3種類の値を指定することになります。
カラースペース
PDFで使用されるカラースペースの説明に入ります。PDFのカラースペースは大きく3種類のカテゴリに分類されます。

  • デバイスカラースペース
    • DeviceGray
    • DeviceRGB
    • DeviceCMYK
  • CIEベースカラースペース
    • CalGray
    • CalRGB
    • Lab
    • ICCBased
  • 特殊カラースペース
    • Pattern
    • Indexed
    • Separation
    • DeviceN
デバイスカラースペース
出力デバイス上の表現に直接関係するカラー値を指定します。一番簡単な指定方法ですが、同じ指定をしても出力デバイスが異なれば違った色に見えることが多いという欠点もあります。

  • DeviceGray
    無彩色の光の輝度を白と黒の比率で制御します。カラー値の成分は1つであり、黒 0 ~白 1の範囲で表現されます。
  • DeviceRGB
    加法混色の3原色 赤・緑・青(R,G,B)を成分に持ち、各成分の値を 0(成分無)~1(最大輝度)で表現します。黒(0,0,0) ~白(1,1,1)となります。
  • DeviceCMYK
    減法混色の4原色 シアン、マゼンタ、イエロー、ブラック (C/M/Y/K)を成分に持ち、各成分の値を0(その成分無)から1(最大濃度)で表現します。白(0,0,0,0)から黒(1,1,1,0) となります。成分Kは、理論的には不要ですが、CMYのインクを混合して黒を生成するより黒インクを使用するほうが印刷上、きれいな黒が表現されるために使用されます。(0,0,0,1)も黒となります。

PDF内で、各カラースペースを混在して指定することができます。たとえば黒でABCと3文字表示されていても「A」はDeviceGrayの0、「B」はDeviceRGBの(0,0,0)、「C」はDeviceCMYKの(1,1,1,0)という場合もあり得ます。(PDF/XやPDF/Aではこのあたりの混在使用を禁止しています)

次回、CIEベースカラースペースについて説明したいと思います。

PDFの色指定について(2)
色とは何か
PDFの色指定 (3)CIE1931 CIELuv CIELAB
CIEカラースペース
PDFの色指定(4)
ICCプロファイル
PDEの色指定(5)CIEベースカラースペース
PDFのCIEベースカラースペース格納形式と使用のされ方の概略



HTML on Word
WebページをWordで作る!


瞬簡PDF 変換 2024
PDFをOffice文書へ高精度変換
Pages: Prev 1 2 3 ... 9 10 11 12 13 14 15 16 17 18 19 Next