タグ別アーカイブ: PDF

PDFをWordやExcelに変換したいけれど、どんな製品がいいのかよく分からない…(2)

PDFを再利用する場合、元となるPDFは内容によって以下の2種類に分けることができます。

1)テキストが含まれているPDF
2)テキストが含まれない画像だけのPDF

1)の「テキストが含まれているPDF」とは、WordやExcelなどで文字入力しPDF化したものが該当します。
このようなPDFからの変換には、『瞬簡PDF 変換 9』が適しています。

瞬簡PDF 変換 9』は、PDFにテキスト・データが含まれていればそれを解析してWordやExcelに変換します。テキスト・データをそのまま変換するため文字化けしたりすることなくWordやExcel形式に移して再利用可能になります。

変換されたいPDFにテキスト・データが含まれるかどうかは、Adobe Reader などでPDFを表示して[編集]メニューから[すべて選択]をクリックしてみてください。
テキスト・データが以下のように反転表示されれば、テキストが含まれるPDFだと判別できます(※)。

pdf

テキストをすべて選択

 

※ スキャナーで作成された画像には、スキャナーがOCR処理をかけてテキスト・データをPDFに埋め込むことがあります(透明テキストつきPDF)。この場合は同じようにテキスト部分が反転して表示されます。

2)の「テキストが含まれない画像だけのPDF」とは、紙の書類をスキャナーで読み取ってPDF化したものなどが該当します。
このようなPDFは文字と見える部分も画像でしかないため、そのままWordやExcel形式に変換しても編集のできない画像が貼り付きます。
このようなデータに対しては「OCR」といって画像から文字を認識する機能を使うことでテキスト・データを取り出すことができます。ただし、OCR処理では画像の状態により文字が正しく認識できず、文字化けしてしまうことがあるため注意が必要です。

紙に印刷された内容をWordやExcelで再利用されたい場合は、『瞬簡PDF OCR』が適しています。

瞬簡PDF OCR』はOCR専用製品で、スキャナーからの直接読み込みにも対応しています。
読み込んだ画像はOCR処理し、誤認識した文字を画面上で修正したり編集したりしながら、変換結果に反映させることができます。
(製品の仕様上、常にOCR処理をかけるため、テキスト・データがあらかじめ含まれているPDFを変換する用途には適しません。)

なお、『瞬簡PDF 変換 9』にもOCR機能があり、画像データからテキスト・データを認識して変換することができます。
ただし、スキャナーからの読み込み機能や誤認識した文字を画面上で修正する機能はありません。

瞬簡PDF OCR』は紙の書類の再利用をされたい場合に適しているのに対し、『瞬簡PDF 変換 9』は内容に関わらず複数のPDFを一括して変換されたいような場合に適していると言えます。

どういったPDFを再利用されたいかによって、いずれの製品を選択するかご検討いただければ幸いです。

PDFをWordやExcelに変換したいけれど、望み通りに変換してくれるか心配…

PDFをWordやExcelに変換したいとお考えの場合、どれだけ正確に変換できるかが気になることと思います。
上記2つの製品にはそれぞれ体験版をご用意しておりますので、その変換精度や使い勝手を事前にご確認いただくことができます。

ただし、体験版では以下のような制限がありますので、あらかじめご了承ください。

  • インストールしてから 15日を過ぎると利用できなくなります。
  • ひとつのPDFについて、3ページまで変換可能です。
  • 評価以外の目的で日常業務に利用することはできません。

体験版に関する詳細は、『瞬簡PDF 変換 9 体験版のお申し込み』、または『瞬簡PDF OCR 体験版のお申し込み』をそれぞれご参照ください。


PDFをWordやExcelに変換したいけれど、どんな製品がいいのかよく分からない…(1)

弊社伊那支店の近くには、春に桜で賑わう高遠という町があります。
江戸時代は高遠藩の城下町だったところで、そこかしこに古い時代の面影が残り普段はとても閑かな町です。
そこは、高遠石工と呼ばれる石工集団が活躍したところでもあり、城下の寺には名工といわれた守屋貞治が刻んだ数々の仏さまが遺されています。

正観世音菩薩

正観世音菩薩

写真が下手でうまく伝えられませんが、石なのに柔らかくて温かい表情が何ともいえず好きです。時間と興味のある方は、是非一度現地を訪ねてみてください。

閑話休題。

PDFは紙に代わるデジタルな文書形式として、すっかり身近なものになりました。もともとは閲覧や印刷用途で普及したPDFですが、WordやExcelのように自由に編集して再利用したいというニーズも必然的に増えています。

そのようなニーズに応えてご用意しているのが、弊社のパッケージ製品『瞬簡PDF 変換 9』と『瞬簡PDF OCR』です。

いずれも、PDFをWord(ワード)/Excel(エクセル)/PowerPoint(パワーポイント) の各文書形式に変換することでPDFの再利用が可能な製品です。

なぜPDFから変換をするのに2つも種類があるの? とは、よくお問い合わせをいただくご質問です。

次回は、2つの製品の違いを元になるPDFの観点からご説明します。


「Antenna House AHPDFXML 変換ライブラリ V2.0」の利用例

「Antenna House AHPDFXML 変換ライブラリ V2.0」は、PDFファイルの内部データを、XML(Extensible Markup Language:拡張可能なマークアップ言語)形式に変換するプログラムです。このライブラリが出力するXML形式を「AHPDFXML形式」と呼びます。PDF解析技術により文書構造を生成して、再利用に適したXMLデータを出力します。

「AHPDFXML形式」で表現された様々な情報から、必用な情報を読み取ることでPDFのデータを簡単に再利用できます。

  • 文字や画像の位置情報を利用することで、任意の範囲に含まれるデータを取り出せます。
    例えば、アンケートに使用したPDFの回答欄の文字列だけ取り出すことができます。
    例えば、特定の文字列や画像を含むPDFを探すことができます。
  • 表構造をデータベースに取り込むことにより、データのグループ化がおこなえます。
    PDFには表と言う概念はありませんが「AHPDFXML形式」は、表構造(行列及びセル)を生成します。
    これにより、文字としてでは無く、表としてデータを再利用できます。
    例えば、表構造をCSVに落とすことにより、表計算ソフトに取り出込めます。

XMLで表現することによって、データの扱いが容易になります。
XMLのメリットを最大限に活かしてPDFデータを活用できます。
弊社ウエブサイトより評価版の申し込みが可能です。是非ご評価ください。

製品に関するご質問は
sis@antenna.co.jp(SYSTEM担当)
または
oem@antenna.co.jp(OEM担当)
まで、お気軽にお問い合わせください。

評価版のお申込
評価版のお申込ページ

Webページ
http://www.antenna.co.jp/pdfxml/


「Antenna House AHPDFXML 変換ライブラリ V2.0」の概要

「Antenna House AHPDFXML 変換ライブラリ V2.0」は、PDFファイルの内部データを、XML(Extensible Markup Language:拡張可能なマークアップ言語)形式に変換するプログラムです。このライブラリが出力するXML形式を「AHPDFXML形式」と呼びます。PDF解析技術により文書構造を生成して、再利用に適したXMLデータを出力します。

PDFのデータは、文字、線、画像などが配置されているだけで、文字は見た目順に格納されているとは限らず、段落や表と言う概念もありません。本ライブラリでは、PDFのデータを単にXML化するだけで無く、文書構造を生成して、再利用に適したXMLデータを出力します。「AHPDFXML形式」として出力される主な情報は次の通りです。

  • 段落、行、パラグラフなどの文書情報を生成。
  • 線画情報から、水平/垂直の線分を抜き出して、表構造(行列及びセル)を生成。
  • 文字を見た目順に再配置してから出力。
  • 文字情報は、位置、フォント情報などを出力。
  • 画像情報は、位置、種別などを出力。
  • 画像本体は外部ファイルとして出力。

XMLで表現することによって、データの扱いが容易になります。
XMLのメリットを最大限に活かしてPDFデータを活用できます。
弊社ウエブサイトより評価版の申し込みが可能です。是非ご評価ください。

製品に関するご質問は
sis@antenna.co.jp(SYSTEM担当)
または
oem@antenna.co.jp(OEM担当)
まで、お気軽にお問い合わせください。

評価版のお申込
評価版のお申込ページ

Webページ
http://www.antenna.co.jp/pdfxml/


「瞬簡PDF 書けまっせ 7」ユーザーズマニュアル好評発売中

『瞬簡PDF 書けまっせ 7』など瞬簡PDFシリーズのパッケージ版に同梱する紙のマニュアルは、かなり以前よりスタートアップガイドだけになっていて、製品マニュアルはPDFファイルという形で電子データとして製品に同梱されています。

しかし紙のマニュアルを読みたいというご希望も多くいただいているため、『瞬簡PDF 書けまっせ 7』のユーザーズマニュアルを冊子(紙の本)でお求めいただけるようになっています。これはAmazonなどのプリント・オン・デマンドサービスを利用していて、下記サイトからお買い求めいただくことができます。

『瞬簡PDF 書けまっせ 7 ユーザーズマニュアル オンデマンド(ペーパーバック)』
 Amazon https://www.amazon.co.jp/dp/4900552313/
 楽天ブックス http://books.rakuten.co.jp/rb/14513699/
 honto https://honto.jp/netstore/pd-book_28123752.html

製品インストール後に利用できるPDFマニュアルはA4の用紙にプリンターで印刷することを想定していますが、POD(プリント・オン・デマンド)版のマニュアルは、冊子用に最適化した版面、誌面レイアウトになっています。
紙のマニュアルでじっくり読みたいという方はぜひご利用ください。

他にも『瞬簡PDF 作成 7』製品マニュアルが好評発売中です。
『瞬簡PDF 作成 7 ユーザーズマニュアル オンデマンド(ペーパーバック)』
 Amazon https://www.amazon.co.jp/dp/4900552240/


「瞬簡PDF 書けまっせ 7」で差込印刷(3)

前回までで納品書はいったん完成しました。
しかし、データが納品書の行数を超えるほど多い場合はどうなるのでしょうか? たとえば1ページでは収まらないほど納品データがあった場合、データが無くなるまでページを複写して繰り返すことになります。
データを繰り返し差し込むときの挙動には大きく分けて2種類あります。「全ページ差込」というパラメータがONのときとOFFのときです。(デフォルトはONです)

全ページ差込がONの場合、次の図のようにデータが無くなるまで全ページを複写して繰り返します。

全ページ差込がOFFの場合、[データリピート]というパラメータが関係します。下図のように初めて[データリピート]ONのフィールドがでてきたページのみをデータが無くなるまで繰り返します。

全ページ差し込みOFFはデータを繰り返したいフィールドと繰り返したくないフィールドが混在している場合に使います。

納品書のケースで実際に試してみましょう。
まずデフォルト状態のままで大量のデータを送るとどうなるか試してみます。このデータはテスト用に明細を8行から20行に増やしてあります。
これをセットして印刷するとどうなるか? 印刷プレビューで確認してみましょう。

1ページ目は問題ありませんが、2ページ目を見ると表示がおかしいことが分かります。これは納品先の会社名や日付、納品元の情報が入るべきフィールドに明細データが流し込まれているためです。
デフォルトではすべてのフィールドがデータを繰り返し差し込む対象となるため、このようになってしまうわけです。

まず[差込]タブにある[全ページ差込]のチェックを外したあと、納品先、日付、納品元に関するフィールドをすべて選択状態にして[データリピート]のチェックを外してください。

これで2ページ目も正しく出力されます。

このようにデータを繰り返し挿入したくないフィールドは[データリピート]をOFFにしてください。

 


「瞬簡PDF 書けまっせ 7」で差込印刷(2)

前回に続き「瞬簡PDF 書けまっせ 7」での差込印刷機能について解説していきます。

前回で文書にフィールドを挿入してデータを差し込むところまでできました。このまま印刷でもかまわないのですが、もう少し見た目をよくするためアレンジすることにします。

「商品名」は左端に少し余白を入れ、「数量」は右揃え、「単位」は中央揃え、「単価」、「金額」は右揃えにしてカンマをつけたいところです。

まず「選択モード」が選択されていることを確認してください。

「品番・商品名」列のフィールドをすべて選択します。[Ctrl]を押しながらクリックしていけば複数選択ができます。もしくは列全体を含む範囲をドラッグすることで一度に選択することも可能です。
選択できたら[テキスト]タブを選び、[文字配置]カテゴリの「左右余白」の数値を「2.0」にします。

「数量」列のフィールドをすべて選択して[テキスト]タブ[文字配置]カテゴリのドロップダウンから「右寄せ(中央)」を選びます。このままだと右端ギリギリに配置されてしまうので「左右余白」を「2.0」にします。同じく「単位」列のフィールドを選択して「中央揃え(中央)」を指定します。
「単価」列、「金額」列のフィールドは「右寄せ(中央)」にして「左右余白」を「2.0」に、[表示形式]カテゴリにある「」ボタンを押してください。これで3桁ごとにカンマがつくようになります。

すべてできると次のようになります。(見やすくするためにガイド色、差込順序を非表示にしてあります)

完成した状態をプロジェクトファイルとしてダウンロードできるようにしておきました。差込サンプル
Excelデータと一緒にZIP圧縮されていますので解凍して「瞬簡PDF 書けまっせ 7」で「差込サンプル.wppx」を開けば上記を再現することができます。


「瞬簡PDF 書けまっせ 7」で差込印刷(1)

「瞬簡PDF 書けまっせ 7」には非常に高度な差込印刷機能が備わっています。
しかしながらどうやって使えばよいのか分からない、何ができるのか分からないなど、実際に使いこなしている方は少ないのではないでしょうか? 今回はこの差込印刷機能について数回にわたって解説してきたいと思います。
(本記事は過去の同記事を最新版向けに手直ししたものです)

差込印刷とは?

差込印刷とは文書にデータを埋め込んで印刷することを言います。
「瞬簡PDF 書けまっせ 7」の場合、PDF文書にExcelやCSVデータを埋め込んで印刷したりPDFにすることができます。

納品書をつくってみる

それでは実際に差込印刷機能を使って納品書を作っていきましょう。

  1. まず納品書のPDF文書を開きます。
  2. 次にリボンから[ホーム]タブの[差込]-[差込フィールド ページ全体を自動認識]を選び、ページ全体に差込フィールドを作成します。
  3. この機能はPDF中の矩形を自動認識して差し込みフィールドを作成してくれますが完璧ではないため、フィールドがうまくできなかったり、必要の無い場所にフィールドができたりすることがあります。タイトル部分と最終行、「備考」列全体が不要なので削除してください。
    「備考」列全体のフィールドを削除する場合は次のようにドラッグで一括選択してから削除すると便利です。
    また一行目はフィールドの大きさや位置を調整、数が足りないので[ホーム]タブの[差込]-[差込フィールド ドラッグで作成]で手で追加作成していきます。納品先や日付、担当者のフィールドも追加して次のようにしてください。(差込順序番号は違っていてもかまいません)
  4. 読み込まれたデータは青色のラベルで表示されている差込順序番号の順番にフィールドへ差し込まれていきます。今回はフィールドを追加したり削除したため順序がおかしくなっていますので修正しましょう。
    リボン[差込]タブの[差込順序]-[クリックで指定]を押したあと、フィールドを順番にクリックすることで差込順序番号を1から振っていくことができます。
  5. 最後にリボン[差込]タブのデータソースへ差し込むデータのパスを指定します。これで次のようにデータが差し込まれました。データがはみ出したりしてうまく表示されない場合はフォントサイズやフィールドの余白量などを調整してください。
  6. あとは印刷したりPDF出力をおこなえば良いだけです。いかがだったでしょうか? 基本的には差込フィールドを作ってデータを指定すればよいだけです。 次回はもう少し凝った差込方法について解説します。

 


AH Formatter 機能のご紹介:CGM の描画(ISO/IEC 8632、WebCGM 2.1)

CGM(Computer Graphics Metafile)[1]は、ベクトルグラフィックスを表現する標準ファイル形式です。ISO/IEC 8632 の CGM[2] 及び W3C のWebCGM[3]で規定されています。自動車製造・航空機製造・機械などの製造業で良く使われています[4]

AH Formatter』はCGMとWebCGMを独自開発したエンジンにより描画し、描画した結果を画面に表示したり、印刷したり、PDFの中に線画(ベクタ画像)として作成できます。

CGM はベクタ画像として出力されるため画質は劣化せず高い解像度で描画することが可能です。また、『AH Formatter V6.4』において描画エンジンを完全に書き替え、これまで以上に多くの要素へ対応いたしました。
CGM仕様の実装状況(オンラインマニュアル)

一部ですが、V6.4 において新たに対応した描画を V6.3 と比較した結果を紹介します。
AH Formatter の CGM 描画

CGM 画像は W3C の Test Suite より引用しております。
引用元:WebCGM 2.1 Test Suite. “Copyright © 2002-2006, Lofton Henderson. All Rights Reserved.”

『AH Formatter』のサンプルFO集には、本機能の動作が確認できるサンプル「グラフィクス CGM の表示 (<fo:external-graphic>)」を掲載しております。

なお、CGM を描画するには、『AH Formatter CGM オプション』をご購入していただく必要があります。

『AH Formatter』は主にバージョンアップのたびに機能強化や新機能の追加を行っています。
“あったら便利な機能” も既に追加されていることがございますので、どうぞお気軽にサポートにお問い合わせください。
未実装の機能であれば、ご要望として承り、今後の開発の参考にさせていただきます。

『AH Formatter』の評価版にて CGM の描画をお試しいただけます。
評価版は次のページよりお申し込みいただけます。ご興味のある方は是非お試しください。
AH Formatter 評価版のお申し込み

[1] Computer Graphics Metafile
[2] ISO/IEC 8632-1:1999
[3] WebCGM 2.1
[4]HP Designjet Printers – Usage of the Computer Graphics Metafile (CGM)-Who uses CGM?

※3月26日冒頭部分を更新


『瞬簡PDF 統合版 9』と『瞬簡PDF 書けまっせ 7』販売開始!!

瞬簡PDF 統合版 9/瞬簡PDF 書けまっせ 7 同時発売

お待たせしました。PDF活用に便利な5つのソフトが入った『瞬簡PDF 統合版 9』と、PDFに文字の入力、図形や捺印を挿入できるソフト『瞬簡PDF 書けまっせ 7』を、本日10月14日より発売いたします。

アンテナハウスオンラインショップからパッケージ版(CD-ROM)およびダウンロード版をお求めいただけます。もちろん、全国のパソコンショップや家電量販店、アマゾンなどのネットショップでも購入できます。一部の大型家電量販店では、パソコンソフトコーナーにパッケージ版の陳列がありますので、手に取ってご覧いただけます。店頭にない場合でもお取り寄せできますので、店員にお気軽にお声掛けください。

アンテナハウスオンラインショップでは発売を記念しまして、瞬簡PDF 統合版 9新発売キャンペーンを実施中です(11月13日まで)。

また、「無償バージョンアップキャンペーン!」を2016年12月31日まで実施します。詳しくは「瞬簡PDF 統合版 9 ユーザーサービスのご案内」をご覧ください。

新しくなった『瞬簡PDF 統合版 9』は、同梱のPDFへの書き込みソフトが新バージョンの『瞬簡PDF 書けまっせ 7』になりました。『瞬簡PDF 書けまっせ 7』は以下の強化が行われています。

  • 書類の入力欄を自動認識する処理の速度、精度、機能が大幅に向上しました。
  • タッチ操作とペン入力が切り替えなしで可能になりました。マルチタッチとペン入力ができるパソコンなら、快適に書き込みができます。
  • 修正テープが墨消し機能に対応しました。元のPDFから不要な文字や画像を完全に消去したPDFファイルを出力できます。
  • 他にも図形の大幅追加、透明テキスト、手書きオブジェクトの選択、移動、サイズ変更、コピー& ペーストなど、盛りだくさんの新機能を追加しました。

ますます便利になって、お仕事やご家庭での電子ドキュメントの作成や編集のお役に立つと思います。

⇒ 『瞬簡PDF 統合版 9』のニュースリリース

⇒ 『瞬簡PDF 書けまっせ 7』のニュースリリース


Pages: 1 2 Next