カテゴリー別アーカイブ: 使用方法・利用例

「Antenna House AHPDFXML 変換ライブラリ V2.0」の出力例 (画像情報)

「Antenna House AHPDFXML 変換ライブラリ V2.0」は、PDFファイルの内部データを、
XML(Extensible Markup Language:拡張可能なマークアップ言語)形式に変換するプログラムです。
このライブラリが出力するXML形式を「AHPDFXML形式」と呼びます。
PDF解析技術により文書構造を生成して、再利用に適したXMLデータを出力します。

今回は”画像情報”がAHPDFXMLに出力される例を見てみます。
変換元PDFファイルのスクリーンショットです。
サンプルは、画像”野菜のかご盛り”です。

ahpdfxml_pdf_0202

上記のPDFをAHPDFXML形式に変換したXMLの内容は次の通りです。

ドキュメントXMLの内容です。

ahpdfxml_xml_0202a

  • イメージフレーム ahp:frame-type=image
  • 領域の座標 ahp:l ahp:r ahp:t ahp:b
  • カタログXMLを参照するID ahp:file-id=f1

カタログXMLの内容です。
ahpdfxml_xml_0202b

  • 外部ファイル名 ahp:href=pdf2tmp_0.bmp
  • 画像はBMP ahp:file-type=BMP
  • 参照されるID ahp:id=f1

AHPDFXMLの出力先フォルダのスクリーンショットです。
画像ファイル pdf2tmp_0.bmp が出力されているのがわかります。

ahpdfxml_ss_0202

PDFファイルの中に含まれる画像を取り出すことができます。

XMLで表現することによって、データの扱いが容易になります。
XMLのメリットを最大限に活かしてPDFデータを活用できます。
弊社ウエブサイトより評価版の申し込みが可能です。是非ご評価ください。

製品に関するご質問は
sis@antenna.co.jp(SYSTEM担当)
または
oem@antenna.co.jp(OEM担当)
まで、お気軽にお問い合わせください。

評価版のお申込
評価版のお申込ページ

Webページ
https://www.antenna.co.jp/pdfxml/


CAS-UB:章見出しのPDF用CSSレイアウトカスタマイズ

皆さん、こんにちは。CAS-UB 営業担当です。

CAS-UB成果物の出力レイアウトは、予めテーマとして用意されているものから選択します。さらにそれをカスタマイズできます。今回はCAS-UBのPDFレイアウトカスタマイズとして「章見出し」のデザインをCSSでカスタマイズした事例を紹介します。

章タイトルをCSSでデザインする

PDFのレイアウトをカスタマイズするには、専用のCSS「styleset-pdf.css」ファイルが必要です。
先ずは空っぽのCSSファイルを作成しましょう[1]

章見出しのつくり

章見出しのレイアウトを変更するには、章見出しがどのようなレイアウト構成を持っているかを事前に把握しておく必要があります。

下の図を見ながら確認しましょう。

CAS-UBの記事編集画面の上部には、「タイトル」欄と、その横に「記事の種類」リストが並んでいます。

記事の種類が「本文:章」となっているとき、「タイトル」欄に挿入されているテキストがPDF出力したとき、「章見出し」になります。

次にCSSの構成を見ていきます。

EPUBに限らずPDF出力でも、「章」と設定されたタイトルには、デフォルトで「章番号」が付与されます(CAS-UB 生成画面より、PDFの「レイアウト設定」画面で変更が可能)。章番号を見出しに出す場合、これもCSSでカスタマイズすることができます。

PDF出力の場合のCSS属性は下記のとおりです。

項目 クラス属性 分類
章タイトル s-title-level1 ブロック
章番号 s-title-level1-number インライン
章タイトル・テキスト s-title-level1-text インライン

単純なものならば、この3つのクラス属性についてCSSを指定するだけで、見映えのする章見出しをデザインできます。

レイアウト設定例

章タイトル-縦組扉中央 章番号:黒地白抜き、章タイトル:白地黒抜き

章見出しのPDFレイアウトを予めCAS-UBの生成画面より、PDF:レイアウト詳細設定で設定しておきます。

  • 見出し番号レベル:1:章のみ(0:番号なし以外を選択)
  • 章扉の作り方:章扉を作り、その裏のページから節
  • 章扉の文字組方向:縦組
  • 章扉のタイトルの行進行方向の:中央
CSSコード
.s-title-level1{
font-weight: bold;
}
.s-title-level1-number{
padding:0.8em 0.8em 0 0.8em;
background-color:black;
border:1px solid black;
color:white;
}
.s-title-level1-text{
padding:0.8em;
border:1px solid black;
}

章タイトル-縦組扉なし、ライン

PDF:レイアウト詳細設定

  • 見出し番号レベル:1:章のみ(0:番号なし以外を選択)
  • 章扉の作り方:章は作らず、章は改ページで始まる
  • 章(見出しレベル1)>位置 レベル1:行頭寄せ
CSSコード
.s-title-level1{
font-weight: bold;
margin-top:-0.25em;
padding-top: 0.75em;
border-top:2px solid black;
border-right: 2px solid black;
padding-right:3px;
}
.s-title-level1-number{
background-color:black;
color:white;
}
.s-title-level1-text{
margin-top:1em;
}

PDF出力はEPUBと異なり、ユーザーが自由にCSSを設定することはできませんが、ある程度のデザイン力はありますので是非この機能を使ってみてください。

PDF出力用のCSS設定については、CAS-UBサイトの「サポート&ガイド一覧」より、CAS-UB PDF生成のためのガイド「第6章 見出しと本文にメリハリを付ける」をご参照ください。

CAS-UBサポート&ガイド一覧

[1] PDFのレイアウトカスタマイズ用のスタイルシートファイルはCSS(Cascading Style Sheets)の書き方を採用していますが、CSSそのものではなく、使えるプロパティの名前や値はCSSとは若干違いますのでご注意ください。


Office Server Document Converter のご利用例

「Office Server Document Converter」は、MicroSoft Officeを使用せずに PDF や、画像に変換することができます。
文書管理システムでサムネイルを生成する為に幅広くご利用頂いております。

  • MicorSoft Office のライセンスの問題
    MicroSoft Office を使用しないため、MicroSoft Office のライセンスが不要。
  • Windows 以外のプラットフォームでも動作
    Linux 環境でも PDF や画像に変換。
  • セキュリティ対策
    MicroSoft Office を起動しないため、マクロ実行を防ぎセキュリティ上安全に
    PDF 変換可能。

評価版を用意しております。

評価版のお申込
評価版のお申込ページ


デスクトップ製品のサイトライセンスは10本から

デスクトップ製品とは

アンテナハウスでは、パソコンの本体にインストール(仮想環境は除く)して、そのパソコンの画面で操作することのできるパソコン用ソフトウエアのことを「デスクトップ製品」と呼んでいます。もちろんノートパソコン(ノートPC)でも同じように動かすことができます。

【参考】デスクトップ製品、システム製品とは?

サイトライセンスとは

デスクトップ製品を複数のパソコンに導入(インストール)してご利用の場合、必要な数だけデスクトップ製品をお求めいただくか、必要な数をライセンス(証書による使用許諾)でご購入いただく方法があります。サイトライセンスとはそうしたライセンスのひとつです。

【参考】サイトライセンスとシンクライアントライセンス

ただし、サイトライセンスは10ライセンス以上をまとめてご購入いただく必要があります。下記のページでは、10ライセンス以上をご購入の際の1ライセンス当たりの価格(=単価)をご紹介しています。

【参考】アンテナハウス デスクトップ製品のライセンス販売の価格とお申し込み

ひとつのデスクトップ製品をダウンロード版などでおおよそ6本以上ご購入予定であれば、サイトライセンスの最低数10本の価格の方が割安になってくる計算です。ぜひご検討ください。


Office Server Document Converter の活用法(3)

■ TextPorter と組み合わせた文書管理システム

企業や組織においては、毎日、膨大な数の文書が、Microsoft Office で作られています。それを紙に印刷していたのでは、保管も閲覧も大変です。
そこで、これらの文書を電子文書のままファイリングし、管理する文書管理システムが作られています。
ここで、Office Server Document Converter と、弊社のサーバ製品の1つである TextPorter が活躍しています。TextPorter は、Microsoft Office 文書や PDF から、テキストを抽出する製品です。

システムのイメージは、
Office Server Document Converter 活用例
にある
サムネイルサーバ
を発展させたものと思っていただけるといいです。

Office Server Document Converter によって、文書からサムネイルを生成することで、ファイル名だけではわかりにくい文書の見分けも簡単にできるようになります。
そして、TextPorter で文書からテキストを抽出して、全文検索システムで検索できるようにしておくことで、目的の文書をすばやく探し出して、そのサムネイルをみて、実際の文書を引っ張り出せるようにするわけです。

TextPorter に関する詳しい情報は、
https://www.antenna.co.jp/axx/
を、ぜひ、ご覧ください。

〒103-0004
東京都中央区東日本橋2-1-6 東日本橋藤和ビル5F
アンテナハウス株式会社
◆ご購入に関するお問い合わせ(祝日を除く月~金曜日9:30~18:00)
TEL : 03-5829-9021
FAX : 03-5829-9023
E-mail: sis@antenna.co.jp
URL : https://www.antenna.co.jp/

Office Server Document Converter は、Microsoft Office, PDF などのファイルを、PDF, Flash, SVG, 各種画像形式にダイレクトに変換する変換エンジンです。 ダイレクト変換の意味は、たとえば、Microsoft Office がない環境でも、ファイルさえあれば、それをダイレクトに内容を見える形式に変換できるのです。ダイレクト変換には、Microsoft Office のライセンスも不要です。
Office Server Document Converter は、ダイレクト変換というユニークさが評価され、多くのウェブサービス、パブリッククラウド、プライベートクラウドなどで利用されています。

Office Server Document Converter に関する詳しい情報は、
Office Server Document Converter
を、ぜひ、ご覧ください。

評価版もご用意しております。
Office Server Document Converter 評価版のお申し込み
から、お申し込みください。

<< Office Server Document Converter の活用法(2)


Office Server Document Converter の活用法(2)

■ PDF生成サーバ

普段使用している Microsoft Office ファイルをファイルサーバへ Upload し、後は、Office Server Document Converter で PDF ファイルを作成できます。
作成する PDF ファイルには「印刷不可」等のセキュリティ設定も付けることができるので、利用目的に合わせた PDF ファイルを随時作成可能になります。

Office Server Document Converter:PDF生成サーバ

更に。。。

PDFToolAPI を使用することにより、「しおり」の作成や、ファイルの分割・統合も可能です。さらに、Web 経由にて PDF ファイルを表示する際には、スマホや携帯電話などの利用環境がシビアな場合にも対応できるように「リニアライズ PDF」も作成できます。

* PDFToolAPI の機能は上記の他に「指定ページ抽出」や「文書情報設定・取得機能」「すかし」「墨消し」等があります。 詳しくは、PDFToolAPI を参照してください。

Textporter で検索 Index 用のテキストデータを抽出し元ファイルと関連付けすることにより全文検索の対象とすることも可能です。

* Textporter の機能は上記の他に「ファイル識別」「プロパティ抽出」「文字コード変換」等があります。 詳しくは、 Textporter を参照してください。

〒103-0004
東京都中央区東日本橋2-1-6 東日本橋藤和ビル5F
アンテナハウス株式会社
◆ご購入に関するお問い合わせ(祝日を除く月~金曜日9:30~18:00)
TEL : 03-5829-9021
FAX : 03-5829-9023
E-mail: sis@antenna.co.jp
URL : https://www.antenna.co.jp/

Office Server Document Converter は、Microsoft Office, PDF などのファイルを、PDF, Flash, SVG, 各種画像形式にダイレクトに変換する変換エンジンです。 ダイレクト変換の意味は、たとえば、Microsoft Office がない環境でも、ファイルさえあれば、それをダイレクトに内容を見える形式に変換できるのです。ダイレクト変換には、Microsoft Office のライセンスも不要です。
Office Server Document Converter は、ダイレクト変換というユニークさが評価され、多くのウェブサービス、パブリッククラウド、プライベートクラウドなどで利用されています。

Office Server Document Converter に関する詳しい情報は、
Office Server Document Converter
を、ぜひ、ご覧ください。

評価版もご用意しております。
Office Server Document Converter 評価版のお申し込み
から、お申し込みください。

<< Office Server Document Converter の活用法(1)

 Office Server Document Converter の活用法(3) >>


Office Server Document Converter の活用法(1)

■ ファイルの無害化

Office Server Document Converter は、Microsoft Office 文書の変換においてマクロを実行しません。
したがって、マクロ内に不正なコードが合った場合にもその実行は行われずにPDFや画像、SVG, Flash といった形式のファイルを生成できます。
PDF に関しても Script を実行することはないので画像や SVG, Flash といった形式のファイルを生成できます。また、PDF から PDF への変換も可能です。
企業ユーザ様、特にグローバル企業では、様々なファイルを日々受け取っていることと思われます。そのような場合でもよりセキュアな状態でファイルを取り扱うことが可能となります。
また、官公庁や学校等で使用するファイルに関しても、Office Server Document Converter でいろいろな形式に変換することにより、より確実に無害化されたファイルを取り扱えるようになります。

Office Server Document Converter:PDF生成サーバ

〒103-0004
東京都中央区東日本橋2-1-6 東日本橋藤和ビル5F
アンテナハウス株式会社
◆ご購入に関するお問い合わせ(祝日を除く月~金曜日9:30~18:00)
TEL : 03-5829-9021
FAX : 03-5829-9023
E-mail: sis@antenna.co.jp
URL : https://www.antenna.co.jp/

Office Server Document Converter は、Microsoft Office, PDF などのファイルを、PDF, Flash, SVG, 各種画像形式にダイレクトに変換する変換エンジンです。 ダイレクト変換の意味は、たとえば、Microsoft Office がない環境でも、ファイルさえあれば、それをダイレクトに内容を見える形式に変換できるのです。ダイレクト変換には、Microsoft Office のライセンスも不要です。
Office Server Document Converter は、ダイレクト変換というユニークさが評価され、多くのウェブサービス、パブリッククラウド、プライベートクラウドなどで利用されています。

Office Server Document Converter に関する詳しい情報は、
Office Server Document Converter
を、ぜひ、ご覧ください。

評価版もご用意しております。
Office Server Document Converter 評価版のお申し込み
から、お申し込みください。

Office Server Document Converter の活用法(2)>>


SBC と OSDCの 相違点

Server Based Converter V6.0 と Office Server Document Converter V6.1 の機能的な差はありません。Server Based Converter V6.0 MR4 と Office Server Document Converter V6.1 MR1 は、ほぼ同じ Source で作成されております。その関係は、今後も販売終了まで継続されます。

Server Based Converter V6.0 と Office Server Document Converter V6.1 の違いは、

1) 製品名称
2) 一部モジュールの名称変更
3) 製品カテゴリの追加
4) Flash 出力版の廃止
5) Web Interface の追加

となります。

【一部モジュールの名称変更】
弊社別製品にて使用している同一名称のライブラリのバージョンが異なる場合があるため、問題が発生する場合がありました。この問題を解消するため Server Based Converter で使用している以下の名称を変更いたします。

対象ライブラリ

・ Windows 版

<変更前>
AHFontService14.dll
AHGraphicService11.dll
AHDMC13.dll
AHCommon13.dll
AHPDFLib12.dll

<変更後>
DfvAHFontService14.dll
DfvAHGraphicService11.dll
DfvAHDMC13.dll
DfvAHCommon13.dll
DfvAHPDFLib12.dll

・ Linux 版

<変更前>
libAHGraphicService.so
libGL.so
libOSMesa.so
libGLU.so
libAHDMC.so
libAHCommon.so
libAHPDFLib.so
libAHFontService.so.1.4
libPdfiumModule.so
<変更後>
libDfvAHGraphicService.so
libDfvGL.so
libDfvOSMesa.so
libDfvGLU.so
libDfvAHDMC.so
libDfvAHCommon.so
libDfvAHPDFLib.so
libDfvAHFontService.so.1.4
libDfvPdfiumModule.so

*法則としては、Windows 版は、【Dfv】+【旧名称】となり、Linux版は【lib】+【Dfv】+【旧名称】となります。

【製品カテゴリの追加】
製品カテゴリを一部変更し、Microsoft Word/Excel/PowerPoint の各読込に限定(一部例外あり)した「Select 」版を設けます。
価格などは、こちら をご確認ください。

【Flash 出力版の廃止】
Flash 出力版の販売終了しました。Flash 出力が必要な場合は、Professional 版をご購入ください。

なお、個別契約となる OEM(組込み)契約や ASP/SaaS 契約の場合は、そのご契約内容毎にこれからも販売していきます。

【開発環境の変更】
OSDC は、以下の開発環境で作成されています。

・ Windows 版

<C/C++>
Microsoft Visual C++ 2015 でビルドされています。SampleGUI を除き、MFC は使われていません。 呼び出し側のプログラムは、互換性のあるコンパイラをご使用ください。

<.NET Framework 4.0/4.5.x/4.6 (DfvDotNet40Ctl60.dll) VisualStudio 2010>
VisualStudio 2012
VisualStudio 2013
VisualStudio 2015

<JAVA>
Java SE 8

・ Linux 版

<C/C++>
gcc 4.8

<JAVA>
Java SE 8

*動作には、libc.so.6(glibc-2.17), libstdc++.so.6 で、これらとバイナリ互換性があるライブラリが必要です。
*Linux 版に関しては、Distribution を指定しての動作保証はしておりませんが、OSDC に必要な開発環境の入手が難しい場合は、CentOS7 以降を推奨いたします。

【Web Interface for OSDC】
インターネットでプログラムレスの変換を実現できる 『Web Interface for OSDC』 を同時に販売しまた。

〒103-0004
東京都中央区東日本橋2-1-6 東日本橋藤和ビル5F
アンテナハウス株式会社
◆ご購入に関するお問い合わせ(祝日を除く月~金曜日9:30~18:00)
TEL : 03-5829-9021
FAX : 03-5829-9023
E-mail: sis@antenna.co.jp
URL : https://www.antenna.co.jp/

Office Server Document Converter は、Microsoft Office, PDF などのファイルを、PDF, Flash, SVG, 各種画像形式にダイレクトに変換する変換エンジンです。 ダイレクト変換の意味は、たとえば、Microsoft Office がない環境でも、ファイルさえあれば、それをダイレクトに内容を見える形式に変換できるのです。ダイレクト変換には、Microsoft Office のライセンスも不要です。
Office Server Document Converter は、ダイレクト変換というユニークさが評価され、多くのウェブサービス、パブリッククラウド、プライベートクラウドなどで利用されています。

Office Server Document Converter に関する詳しい情報は、
Office Server Document Converter
を、ぜひ、ご覧ください。

評価版もご用意しております。
Office Server Document Converter 評価版のお申し込み
から、お申し込みください。


OCRを使いこなそう…(3)

前回 に続いて、PDF 変換ユーティリティ 『瞬簡PDF 変換 9』 の OCR 補正機能についてご説明します。

「OCR結果を補正…」を選択すると、OCR 補正機能で元の画像を表示します。

リボンメニューから「領域認識」ボタンをクリックしてください。
領域認識を実行

OCR 処理で画像をどのようなレイアウトで認識したかが分かりやすく表示されます。
赤枠で示された部分は横書きのテキスト領域、青枠で示された部分は画像領域、緑色で示された部分は表の領域を示しています。

問題の宛名部分は青枠で囲まれ、画像領域として認識されていたことが分かります。
これをテキスト領域に変更してやればよさそうです。

変更したい部分を選択して、リボンメニューから「文字横書き」ボタンをクリックします。
領域を変更

これで選択した箇所が赤枠で示されて横書きのテキスト領域に変更されます。
リボンメニューから「変換実行」ボタンをクリックしてみましょう。
変換を実行

変換が終了後、変換結果を Excel で表示すると宛名部分がテキストで変換されたことが確認できます。
補正された変換結果
OCR による誤認識を100%防止することは難しいものですが、OCR 補正機能を利用して作業の効率アップにつなげていただければ幸いです。

—————————
「瞬簡PDF 変換 9」は体験版をご用意しております。
これにより、変換精度や使い勝手を事前にご確認いただくことができます。

体験版では以下のような制限がありますので、あらかじめご了承ください。

  • インストールしてから 15日を過ぎると利用できなくなります。
  • ひとつの PDF について、3ページまで変換可能です。
  • 評価以外の目的で日常業務に利用することはできません。

体験版に関する詳細は、『瞬簡PDF 変換 9 体験版のお申し込み』 をご参照ください。

<< OCRを使いこなそう…(2)


OCRを使いこなそう…(2)

本日は、PDF 変換ユーティリティ 『瞬簡PDF 変換 9』 の OCR 補正機能についてご説明します。

以下のような画像を Excel に変換してみます。
サンプル画像

『瞬簡PDF 変換 9』 の既定値で変換すると以下のようになります。
既定値の変換結果

納品書の宛先部分が Excel で画像になってしまっています。
これは、本来テキストで認識してもらいたい部分ですが、OCR 処理では画像と誤認識してしまったようです。
Excel 上で元のテキストに編集し直すのは手間がかかります。

このような時、OCR 補正機能がお役にたちます。
元のファイル名を右クリックして表示されたメニューから「OCR結果を補正…」を選択してください。
OCR補正機能の呼び出し

—————————
「瞬簡PDF 変換 9」は体験版をご用意しております。
これにより、変換精度や使い勝手を事前にご確認いただくことができます。

体験版では以下のような制限がありますので、あらかじめご了承ください。

  • インストールしてから 15日を過ぎると利用できなくなります。
  • ひとつの PDF について、3ページまで変換可能です。
  • 評価以外の目的で日常業務に利用することはできません。

体験版に関する詳細は、『瞬簡PDF 変換 9 体験版のお申し込み』 をご参照ください。

<< OCRを使いこなそう…(1)      OCRを使いこなそう…(3) >>


Pages: Prev 1 2 3 4 5 6 7 8 9 10 11 12 Next