カテゴリー別アーカイブ: 使用方法・利用例

PDFをWordやExcelに変換したいけれど、どんな製品がいいのかよく分からない…(2)

PDFを再利用する場合、元となるPDFは内容によって以下の2種類に分けることができます。

1)テキストが含まれているPDF
2)テキストが含まれない画像だけのPDF

1)の「テキストが含まれているPDF」とは、WordやExcelなどで文字入力しPDF化したものが該当します。
このようなPDFからの変換には、『瞬簡PDF 変換 9』が適しています。

瞬簡PDF 変換 9』は、PDFにテキスト・データが含まれていればそれを解析してWordやExcelに変換します。テキスト・データをそのまま変換するため文字化けしたりすることなくWordやExcel形式に移して再利用可能になります。

変換されたいPDFにテキスト・データが含まれるかどうかは、Adobe Reader などでPDFを表示して[編集]メニューから[すべて選択]をクリックしてみてください。
テキスト・データが以下のように反転表示されれば、テキストが含まれるPDFだと判別できます(※)。

pdf

テキストをすべて選択

 

※ スキャナーで作成された画像には、スキャナーがOCR処理をかけてテキスト・データをPDFに埋め込むことがあります(透明テキストつきPDF)。この場合は同じようにテキスト部分が反転して表示されます。

2)の「テキストが含まれない画像だけのPDF」とは、紙の書類をスキャナーで読み取ってPDF化したものなどが該当します。
このようなPDFは文字と見える部分も画像でしかないため、そのままWordやExcel形式に変換しても編集のできない画像が貼り付きます。
このようなデータに対しては「OCR」といって画像から文字を認識する機能を使うことでテキスト・データを取り出すことができます。ただし、OCR処理では画像の状態により文字が正しく認識できず、文字化けしてしまうことがあるため注意が必要です。

紙に印刷された内容をWordやExcelで再利用されたい場合は、『瞬簡PDF OCR』が適しています。

瞬簡PDF OCR』はOCR専用製品で、スキャナーからの直接読み込みにも対応しています。
読み込んだ画像はOCR処理し、誤認識した文字を画面上で修正したり編集したりしながら、変換結果に反映させることができます。
(製品の仕様上、常にOCR処理をかけるため、テキスト・データがあらかじめ含まれているPDFを変換する用途には適しません。)

なお、『瞬簡PDF 変換 9』にもOCR機能があり、画像データからテキスト・データを認識して変換することができます。
ただし、スキャナーからの読み込み機能や誤認識した文字を画面上で修正する機能はありません。

瞬簡PDF OCR』は紙の書類の再利用をされたい場合に適しているのに対し、『瞬簡PDF 変換 9』は内容に関わらず複数のPDFを一括して変換されたいような場合に適していると言えます。

どういったPDFを再利用されたいかによって、いずれの製品を選択するかご検討いただければ幸いです。

PDFをWordやExcelに変換したいけれど、望み通りに変換してくれるか心配…

PDFをWordやExcelに変換したいとお考えの場合、どれだけ正確に変換できるかが気になることと思います。
上記2つの製品にはそれぞれ体験版をご用意しておりますので、その変換精度や使い勝手を事前にご確認いただくことができます。

ただし、体験版では以下のような制限がありますので、あらかじめご了承ください。

  • インストールしてから 15日を過ぎると利用できなくなります。
  • ひとつのPDFについて、3ページまで変換可能です。
  • 評価以外の目的で日常業務に利用することはできません。

体験版に関する詳細は、『瞬簡PDF 変換 9 体験版のお申し込み』、または『瞬簡PDF OCR 体験版のお申し込み』をそれぞれご参照ください。


「Antenna House AHPDFXML 変換ライブラリ V2.0」の利用例

「Antenna House AHPDFXML 変換ライブラリ V2.0」は、PDFファイルの内部データを、XML(Extensible Markup Language:拡張可能なマークアップ言語)形式に変換するプログラムです。このライブラリが出力するXML形式を「AHPDFXML形式」と呼びます。PDF解析技術により文書構造を生成して、再利用に適したXMLデータを出力します。

「AHPDFXML形式」で表現された様々な情報から、必用な情報を読み取ることでPDFのデータを簡単に再利用できます。

  • 文字や画像の位置情報を利用することで、任意の範囲に含まれるデータを取り出せます。
    例えば、アンケートに使用したPDFの回答欄の文字列だけ取り出すことができます。
    例えば、特定の文字列や画像を含むPDFを探すことができます。
  • 表構造をデータベースに取り込むことにより、データのグループ化がおこなえます。
    PDFには表と言う概念はありませんが「AHPDFXML形式」は、表構造(行列及びセル)を生成します。
    これにより、文字としてでは無く、表としてデータを再利用できます。
    例えば、表構造をCSVに落とすことにより、表計算ソフトに取り出込めます。

XMLで表現することによって、データの扱いが容易になります。
XMLのメリットを最大限に活かしてPDFデータを活用できます。
弊社ウエブサイトより評価版の申し込みが可能です。是非ご評価ください。

製品に関するご質問は
sis@antenna.co.jp(SYSTEM担当)
または
oem@antenna.co.jp(OEM担当)
まで、お気軽にお問い合わせください。

評価版のお申込
評価版のお申込ページ

Webページ
https://www.antenna.co.jp/pdfxml/


「Antenna House AHPDFXML 変換ライブラリ V2.0」の概要

「Antenna House AHPDFXML 変換ライブラリ V2.0」は、PDFファイルの内部データを、XML(Extensible Markup Language:拡張可能なマークアップ言語)形式に変換するプログラムです。このライブラリが出力するXML形式を「AHPDFXML形式」と呼びます。PDF解析技術により文書構造を生成して、再利用に適したXMLデータを出力します。

PDFのデータは、文字、線、画像などが配置されているだけで、文字は見た目順に格納されているとは限らず、段落や表と言う概念もありません。本ライブラリでは、PDFのデータを単にXML化するだけで無く、文書構造を生成して、再利用に適したXMLデータを出力します。「AHPDFXML形式」として出力される主な情報は次の通りです。

  • 段落、行、パラグラフなどの文書情報を生成。
  • 線画情報から、水平/垂直の線分を抜き出して、表構造(行列及びセル)を生成。
  • 文字を見た目順に再配置してから出力。
  • 文字情報は、位置、フォント情報などを出力。
  • 画像情報は、位置、種別などを出力。
  • 画像本体は外部ファイルとして出力。

XMLで表現することによって、データの扱いが容易になります。
XMLのメリットを最大限に活かしてPDFデータを活用できます。
弊社ウエブサイトより評価版の申し込みが可能です。是非ご評価ください。

製品に関するご質問は
sis@antenna.co.jp(SYSTEM担当)
または
oem@antenna.co.jp(OEM担当)
まで、お気軽にお問い合わせください。

評価版のお申込
評価版のお申込ページ

Webページ
https://www.antenna.co.jp/pdfxml/


Office Server Document Converter のご利用目的

「Office Server Document Converter」は、Microsoft Office を使用せずに PDF や、画像に変換することができます。
以下のような問題を抱えているユーザ様に幅広くご利用頂いております。

  • Microsoft Office のライセンスの問題
    Microsoft Office を使用しないため、Microsoft Office のライセンスが不要。
  • セキュリティ対策
    Microsoft Office を起動しないため、マクロ実行を防ぎセキュリティ上安全に PDF 変換できます。
  • Windows 以外のプラットフォームでも動作
    Linux 環境でも PDF や画像に変換できます。

変換精度に関しては日々改善を行っております。最新の評価版で変換精度を是非ご評価ください。

評価版のお申込
評価版のお申込ページ

Webページ
https://www.antenna.co.jp/sbc/


「瞬簡PDF 書けまっせ 7」紙と鉛筆の操作性-PDFへの手書き入力

『瞬簡PDF 書けまっせ 7』では手書き入力とタッチ操作が強化され、さらに使いやすくなっています。

紙と鉛筆の操作性

紙に何かを書く時、書きやすいように紙の位置を調整しながら書きますよね?
『瞬簡PDF 書けまっせ 7』ではまさにこれと同じ感覚でPDFに手書きすることができるんです。
詳しくはこちらをご覧ください。

設定方法

これはつまり画面を指でなぞるとスクロールになり、ペンでなぞると手書き入力になるということですが、このように機能させるためには条件と設定が必要になります。

まず条件ですが、マルチタッチおよびペン両方に対応したPCまたはタブレットが必要になります。
ペンは専用のものが必要で、市販のスタイラスペンではできませんので注意してください。

条件に合うPCやタブレットがあれば、次のような設定をおこなってください。

  1. 『瞬簡PDF 書けまっせ 7』を起動して適当なPDFファイルを開いてください。
  2. リボンから[ファイル]タブにある[オプション]を選択してください。
  3. 「ペン選択時の入力モード」のドロップダウンを開きます。 最初は「すべて許可する」になっていると思いますので「モード 1」に切り替えてください。
    ※表示されるモードの数はPCによって異なります。
  4. [OK]ボタンを押してオプション画面を終了します。
  5. リボンから[ホーム]タブ[手書き]グループにある「ペン」を押してください。
  6. タッチ操作とペン入力を試してください。タッチ操作でスクロールや拡大縮小、ペン入力で手書き入力ができればOKです。
    うまくいかない場合は3に戻り、他のモードに変更して試してみてください。
  7. 設定は少し面倒ですが一度やっておけばずっと有効です。
    マルチタッチとペン両対応のPCをお持ちであればぜひこの設定を行い、快適な「紙と鉛筆の操作性」を味わっていただきたいと思います。


Server Based Converter Web ページの更新

今年に入り、Server Based Converter の Web ページに以下のコンテンツを増やしております。また、既存ページに関しても、内容の拡充をおこなっております。是非、ご覧ください。

<新規ページ>

XML ファイルへの対応
Server Based Converter では、OOX(Open XML 形式)ファイル、及び ODF(OpenDocumentFile)への対応を進めています。その進捗状況と成果をまとめたページを公開しました。

XMLファイルへの対応

■ Office Open XML の概要紹介
Microsoft Office で作成される XML 形式ファイルの活用方法を考察、紹介したページを公開しました。

メリットと活用アプリケーション
Microsoft Officeファイルを自力で変換

■ 変換精度
Server Based Converter を使用し、Microsoft Office 文書を JPEG に変換した結果を Web ページに公開しました。
単ページの書面の元アプリケーション(Word/Excel/PowerPoint)と変換結果 JPEG の比較です。 ご参照ください。

変換精度

<内容の拡充>

■ SVG 変換
Server Based Converter を使用して SVG(Scalable Vector Graphics )形式に変換するページに変換精度、その他を追加しました。

変換精度

■ Flash(SWF)変換
Server Based Converter を使用して SWF(Adobe Flash)形式に変換するページに参考資料、その他を追加しました。

変換精度

以上です。
今後も、新しいコンテンツの追加、及び各ページの拡充をすすめていきます。

〒103-0004
東京都中央区東日本橋2-1-6 東日本橋藤和ビル5F
アンテナハウス株式会社
◆ご購入に関するお問い合わせ(祝日を除く月~金曜日9:30~18:00)
TEL : 03-5829-9021
FAX : 03-5829-9023
E-mail: sis@antenna.co.jp
URL : https://www.antenna.co.jp/

Server Based Converter は、Microsoft Office, PDF などのファイルを、PDF, Flash, SVG, 各種画像形式にダイレクトに変換する変換エンジンです。 ダイレクト変換の意味は、たとえば、Microsoft Office がない環境でも、ファイルさえあれば、それをダイレクトに内容を見える形式に変換できるのです。ダイレクト変換には、Microsoft Office のライセンスも不要です。
Server Based Converter は、ダイレクト変換というユニークさが評価され、多くのウェブサービス、パブリッククラウド、プライベートクラウドなどで利用されています。

Server Based Converter に関する詳しい情報は、
Server Based Converter
を、ぜひ、ご覧ください。

評価版もご用意しております。
サーバベース・コンバーター 評価版のお申し込み
から、お申し込みください。


Server Based Converter の活用法(3)

■ファイルの無害化

Server Based Converter は、Microsoft Office 文書の変換においてマクロを実行しません。 したがって、マクロ内に不正なコードが合った場合にもその実行は行われずに PDF や画像、SVG, Flash といった形式のファイルを生成できます。 また、PDF に関しても Script を実行することはないので画像や SVG, Flash といった形式のファイルを生成できます。

企業ユーザ様、特にグローバル企業では、様々なファイルを日々受け取っていることと思われます。そのような場合でもよりセキュアな状態でファイルを取り扱うことが可能となります。また、官公庁や学校等で使用するファイルに関しても、Server Based Converter でいろいろな形式に変換することにより、より確実に無害化されたファイルを取り扱えるようになります。

サーバベース・コンバーター:PDF生成サーバ

〒103-0004
東京都中央区東日本橋2-1-6 東日本橋藤和ビル5F
アンテナハウス株式会社
◆ご購入に関するお問い合わせ(祝日を除く月~金曜日9:30~18:00)
TEL : 03-5829-9021
FAX : 03-5829-9023
E-mail: sis@antenna.co.jp
URL : https://www.antenna.co.jp/

Server Based Converter は、Microsoft Office, PDF などのファイルを、PDF, Flash, SVG, 各種画像形式にダイレクトに変換する変換エンジンです。 ダイレクト変換の意味は、たとえば、Microsoft Office がない環境でも、ファイルさえあれば、それをダイレクトに内容を見える形式に変換できるのです。ダイレクト変換には、Microsoft Office のライセンスも不要です。
Server Based Converter は、ダイレクト変換というユニークさが評価され、多くのウェブサービス、パブリッククラウド、プライベートクラウドなどで利用されています。

Server Based Converter に関する詳しい情報は、
Server Based Converter
を、ぜひ、ご覧ください。

評価版もご用意しております。
サーバベース・コンバーター 評価版のお申し込み
から、お申し込みください。


PDF を Word や Excel に変換!PDF 変換機能をアプリケーションに簡単に組み込むライブラリのご紹介(2)

昨日 に続いて、『Antenna House PDF to Office 変換ライブラリ Ver.1.2.0』(以下、本ライブラリ)をご紹介します。

本ライブラリは、各種アプリケーションへの組み込み用ライブラリとしてご提供します。

以下は、ライブラリを使用してPDFからExcelに変換したサンプルです。

PDF to Office 変換サンプル

さまざまなアプリケーションへの組み込みに対応するため、ライブラリには C/C++、.NET、Java、コマンドラインの各インタフェースが用意されています。
標準的な変換を行うために必要なステップは非常に短いものです。

以下に、サンプルコード(C#の例:一部抜粋)を示します。

	using PtoDotNetCtl;

	public class MainApp
	{
		static public void Main(string[] args)
		{
			...
			PtoObj p_obj = null;
			p_obj = new PtoObj();
			p_obj.setDocumentPath(args[0], "");
			p_obj.setOutputFilePath(args[1]);
			p_obj.setPrinterName(args[2]);
			p_obj.setOptionFilePath(args[3]);
			p_obj.doConvert();
			...
			finally
			{
				if (p_obj != null)
					p_obj.Dispose();
			}
		}
	}

貴社アプリケーションにて PDF から Office への変換機能を活用するため、本ライブラリをご検討いただければ幸いです.

本ライブラリに関する詳細は、『Antenna House PDF to Office 変換ライブラリ』をご参照ください。
本ライブラリの価格・ライセンス条件等、詳しくは、oem@antenna.co.jp までお問い合わせください。

<< ご紹介(1)


謎のファイルを見るためのソフトは意外と簡単に作れます

謎のファイルを見る機能をSDKで提供します

今週、小説「Qrosの女」(誉田哲郎著)に登場する「自在くん」というマルチビューアソフト(マルチファイルビューア)をご紹介しました。その際、このソフトと同様の機能を持つデスクトップアプリ(パソコン上で動かすソフトウエア)として、弊社の「自在眼」もご紹介しました。

実は、弊社製品「自在眼」のビューア機能をライブラリ(SDK)としても販売しております。お手元で開発されているWindowsアプリケーションに、弊社「自在眼」の機能を組み込むことができ、製品として販売することも可能です。

もし、自力で「自在くん」を作りたいという方は、ぜひ、お問い合わせください。担当はOEMグループです。

マルチ・ファイルビューア 自在眼(パッケージ製品)


謎のファイルをみるためのパソコンソフトの話

小説に出てくる謎のITツール

最近、ある情報筋からミステリー小説の「Qrosの女」(誉田哲郎著)の中で、面白いパソコン用ソフトの紹介があると聞き、アマゾンでその本を買ってみました。2013年刊行で、文庫本にもなっています。

本書の内容は週刊誌記者の芸能取材などをリアルに描いたものですが、あるITツールが印象的なシーンで使われています。

その製品名を「自在くん」といい、USBメモリーの中にある拡張子を偽った大量のファイルをチェックするのに便利なマルチビューアソフトとして紹介されています。

まさに弊社製品の「自在眼」そのものといった印象があります。念のため、講談社の編集部を通じて誉田哲郎さんに質問を依頼したのですが、弊社の製品紹介を目的に著書を使うことは不可とのことで、事実確認はできませんでした。

自在眼」の社会的貢献

自在眼」のユーザーには、インテリジェンスに深い関係のある機関や団体も多数あります。隠匿されたファイルからなんらかの情報を得ようと、今まさにリアルに「自在眼」を使っている方がいるやもしれません。

また、遺品の中にあるパソコンやUSBメモリーなどにある大量のファイルのチェックといったことは、多くの方が遅かれ早かれ現実に体験されると思います。

そんなときはこの「自在眼」が大変役立つITツールのひとつになるでしょう。

興味のある方は、ぜひ「自在眼」のホームページをご覧ください。

 


Pages: Prev 1 2 3 4 5 6 7 8 9 10 ... 13 14 15 Next