カテゴリー別アーカイブ: PDF活用

AH Formatter:PDFから複数行のテキストをコピペしたときに、不要な改行を避けるには。

こんにちは
AH Formatter』サポート担当です。

『AH Formatter』で作成した PDF をビューアで表示して、
テキストをコピー&テキストエディタなどにペースト(以下コピペ)した時に
改行が入ってしまうというお問い合わせをいただくことがあります。

具体的には、
 <fo:block>AH Formatterはアンテナハウス株式会社の製品です。</fo:block>
 <fo:block>最新版は弊社Webサイトからダウンロードできます。</fo:block>

これを組版した結果が以下のような場合
 組版結果
ここを Adobe Acrobat や Adobe Reader からコピペすると
次のようになります。

 AH Formatterはアンテナハウス株式会社
 の製品です。
 最新版は弊社Webサイトからダウンロー
 ドできます。

このように見た目のまま、改行されてしまっていますね。

データ中に改行コードが挿入されているわけではないので
この結果は PDFビューアに依存します。
別の PDFビューアでは

 AH Formatterはアンテナハウス株式会社 の製品です。 最新版は弊社Webサイトからダウンロー ドできます。

こんな風にひとつの連続したテキストでコピペされる場合もあります。
(改行位置に空白が入っています。)

では、”コピペした時に改行されないようにしたい” 場合はどうすればよいのでしょう。

PDFビューアに依存するので一概には言えないのですが
Adobe Acrobat や Adobe Reader の場合には
『AH Formatter』から “タグ付きPDF” として出力すると
次のようにコピペできます。

 AH Formatterはアンテナハウス株式会社の製品です。
 最新版は弊社Webサイトからダウンロードできます。

こうすれば、元のテキストデータと同じように連続したテキストとしてコピペできます。
ただし、ひとつ注意することがあります。
例えば、下記のような場合です。

<fo:block linefeed-treatment=”preserve” >
 XfoObj axfo = null;
 try {
 axfo = new XfoObj();
 ErrDump eDump = new ErrDump();
 axfo.setMessageListener(eDump);
 axfo.setDocumentURI(args[0]);
 axfo.setOutputFilePath(args[1]);
 axfo.setExitLevel(4);
 axfo.execute();
 }
</fo:block>

マニュアルのソースコード説明などでよくあるケースですが、
ひとつの fo:block にまとめて記述して、
linefeed-treatment=”preserve” で改行コードを有効にした場合です。

AH Formatterでの組版結果は以下のようになります。
 組版結果

このような場合、タグ付けしていない PDF では見た目のまま改行してコピペされますが
タグ付きPDF として出力してコピペすると
fo:block内のテキストはひとつの連続したテキストになってしまいます。
したがって、1行ずつ fo:block で分割する必要があります。

 




瞬簡PDF 作成 2024
ドラッグ&ドロップでPDF作成


瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品!

「瞬簡PDF統合版」と「瞬簡PDF統合版官公庁向け」の違い

「瞬簡PDF統合版10」の発売は来週です!!

来る10月27日、お待たせしております「瞬簡PDF 統合版 10」(以下、通常版と表記)の販売を開始いたします。家電量販店の店頭販売やネットショップ、弊社のオンラインショップ等で一斉に販売されます。

瞬簡PDF 統合版 10」は、前バージョン「瞬簡PDF 統合版 9」と製品の構成は変わっていません。「瞬簡PDF 作成 7」を「瞬簡PDF 作成 8」へ、「瞬簡PDF 編集 6」を「瞬簡PDF 編集 7」へ、それぞれバージョンアップしています。特に新バージョン「瞬簡PDF 編集 7」は多くの機能追加や機能向上を実現した、今回一押しの製品です。

ところで、「瞬簡PDF 統合版 10」(通常版)に先んずること3か月も前の8月から、「瞬簡PDF 統合版 10 官公庁向け」という製品を先行販売しています。以下、官公庁向けと通常版の違いやご購入等について簡単にご紹介します。

「瞬簡PDF統合版10 官公庁向け」は2つの製品を追加

瞬簡PDF 統合版 10」(通常版)に対して、「瞬簡PDF to Image」と「瞬簡PDF サイン2」を追加した製品が「瞬簡PDF 統合版 10 官公庁向け」になります。

「瞬簡PDF to Image」は単体販売していますので、個別に追加購入することも可能ですが、「瞬簡PDF サイン2」は単独での販売は行っておりません。もし、PDFの電子署名付与や検証などが製品の要件としてあるようでしたら、「瞬簡PDF サイン2」を含む「瞬簡PDF 統合版 10 官公庁向け」をぜひご検討ください。

なお、「瞬簡PDF 統合版 10 官公庁向け」は製品名に「官公庁」と入っておりますが、ご利用を官公庁様のみに限定しているものではなく、民間の企業様、団体様も特に支障なくご利用いただける製品です。

瞬簡PDF 統合版 10 官公庁向け」の販売形態はサイトライセンス(10ライセンス以上)など企業・団体様向けライセンス販売のみで、単品でのお取り扱はございません。価格はデスクトップ製品のライセンスのページをご覧ください。




HTML on Word
WebページをWordで作る!


アウトライナー
PDFを解析して しおり・目次を自動生成

『瞬簡PDF 統合版 9』特別価格キャンペーン残りあとわずか

アンテナハウスオンラインショップでは『瞬簡PDF 統合版 9』特別価格キャンペーンを行っています。
大好評につき、7月20日17時まで期間延長していましたが、残りあと2日となってしまいました。

『瞬簡PDF 統合版 9』は作成・ページ編集・一括Office変換・OCR変換・記入の機能でPDFを最大限に活用できる『瞬簡PDFシリーズ』の 5 製品を同梱したお得なパッケージです!

決めかねている方、迷われている方も、ぜひ、この機会に『瞬簡PDFシリーズ』をご検討下さい。

キャンペーンのURLはこちらです。
https://web.antenna.co.jp/shop/html/products/list.php?category_id=321

「PDFって何」と思った方、まずは下記のページでPDFの基礎をささっと身につけましょう。
アンテナハウス PDF資料室




HTML on Word
WebページをWordで作る!


瞬簡PDF 作成 2024
ドラッグ&ドロップでPDF作成

御礼14万ライセンス突破! お得なライセンス『AH-ULL』のサブスクリプション(短期利用契約)を開始します

東京は暑い日が続いています。梅雨はどこにいったのでしょうか。

さて、下記のグラフをご覧ください。
今年の新年のご挨拶でご紹介したグラフですが、これがもうすぐ14万を超えます。勢いは加速しているようです。

ahull_graph

2011年にスタートした「AH-ULL」は、企業・自治体・官公庁・団体など、同じソフトウェアを複数のPCで使用されるような環境に向けた“超お買い得な”ライセンスです。
AH-ULL」であれば、机上でご利用中のメインPCと、携帯用のサブPCの複数台でご利用される場合も、お一人の利用とカウントすることができます。

この春から「AH-ULL」ライセンスのサブスクリプション方式(1年単位の短期利用契約)を開始しました。詳しくは正規販売代理店の東京インタープレイ株式会社(東京都千代田区)へお問い合わせください。

AH-ULL」はアンテナハウスの「瞬簡PDF」シリーズが対象です。
AH-ULL」の詳細は下記をご覧ください。
https://www.antenna.co.jp/purchase/ahull.html




瞬簡PDF 変換 2024
PDFをOffice文書へ高精度変換


HTML on Word
WebページをWordで作る!

WebページからPDF作成のTips

瞬簡PDF 作成 7』に付属するPDF作成プリンタードライバー『Antenna House PDF Driver 6.0』にはMicrosoft Internet Explorer(IE)用のアドオンがあり、ワンクリックで簡単にブラウザで表示しているWebページからPDFにすることができます。

以前、このブログで便利な利用方法として紹介させていただきました。

IE用アドオンでWebを簡単にPDFへhttps://blog.antenna.co.jp/ILSoft2/archives/1637

それから何年か経ち、この間にPCやデバイスを取り巻く環境も変わってきました。

特にWebではスマホなどのデバイス(携帯端末)からのアクセスが増え、今後はスマホからのWeb検索や閲覧がより多くなり、そういったデバイスで見られることが標準であることを想定してコンテンツを用意しなければならない時代になってきました。
いわゆる「モバイルファースト」です。

先にご紹介したブログの記事は、PCやタブレットなど比較的大きめのディスプレイをもつ端末を想定していましたが、あらゆるコンテンツがスマホに向いてきている現在、やはりPDFもスマホで快適に見ることができるようにしたいところですね。

というわけで、直接弊社の製品とは関係ありませんが、上記の流れでちょっとしたTipsをご紹介したいと思います。

通常のWebページをそのままPDFにした場合、見ている画面に近い状態のページをA4サイズにしたPDFが作成されます。

これをスマホで見てみると、、、老眼でなくても拡大しないとちょっと文字が読めないですね。

では、どうするか。

1.)まず、ページ周りの余白をなくして、少しでも表示領域を大きくします。
これはWebブラウザのページ設定、用紙サイズの設定などに余白の設定があるのでここで調整します。

2.)PC向けのWebページでは2段、3段で列を組んで、メニューや広告など本文に関係ない情報がある場合がありますので、これらを削除します。

このときに便利なのが「ブックマークレット」というWebの技術を利用した部分印刷ができるプログラムや、FirefoxというWebブラウザならプラグイン機能(要追加)を利用して、不要な部分を削除して印刷できるものがあります。

3.)文字を大きくする
(2)で利用したプログラムは文字サイズを大きくする機能もありますので、文字のサイズを大きくします。

4.)用紙サイズを小さくする。
用紙サイズをA4ではなくA5やA6にすることで、画面表示時の縮小率が少なくなるので、結果としてページを大きく表示できます。
ただし、用紙サイズを変更した場合、ページ内の画像については縮小されないので大きな画像はページに収まらなくなる場合があります。(3)の文字の拡大と合わせて調整してみてください。

以上の調整で、スマホでも見やすいPDFを作成できます。ただし、ページによってはうまくいかない場合があったり、ページごとに調整が必要だったりする場合がありますのでご了承ください。




瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識


HTML on Word
WebページをWordで作る!

「瞬簡PDF 書けまっせ 7」紙と鉛筆の操作性-PDFへの手書き入力

『瞬簡PDF 書けまっせ 7』では手書き入力とタッチ操作が強化され、さらに使いやすくなっています。

紙と鉛筆の操作性

紙に何かを書く時、書きやすいように紙の位置を調整しながら書きますよね?
『瞬簡PDF 書けまっせ 7』ではまさにこれと同じ感覚でPDFに手書きすることができるんです。
詳しくはこちらをご覧ください。

設定方法

これはつまり画面を指でなぞるとスクロールになり、ペンでなぞると手書き入力になるということですが、このように機能させるためには条件と設定が必要になります。

まず条件ですが、マルチタッチおよびペン両方に対応したPCまたはタブレットが必要になります。
ペンは専用のものが必要で、市販のスタイラスペンではできませんので注意してください。

条件に合うPCやタブレットがあれば、次のような設定をおこなってください。

  1. 『瞬簡PDF 書けまっせ 7』を起動して適当なPDFファイルを開いてください。
  2. リボンから[ファイル]タブにある[オプション]を選択してください。
  3. 「ペン選択時の入力モード」のドロップダウンを開きます。 最初は「すべて許可する」になっていると思いますので「モード 1」に切り替えてください。
    ※表示されるモードの数はPCによって異なります。
  4. [OK]ボタンを押してオプション画面を終了します。
  5. リボンから[ホーム]タブ[手書き]グループにある「ペン」を押してください。
  6. タッチ操作とペン入力を試してください。タッチ操作でスクロールや拡大縮小、ペン入力で手書き入力ができればOKです。
    うまくいかない場合は3に戻り、他のモードに変更して試してみてください。
  7. 設定は少し面倒ですが一度やっておけばずっと有効です。
    マルチタッチとペン両対応のPCをお持ちであればぜひこの設定を行い、快適な「紙と鉛筆の操作性」を味わっていただきたいと思います。




瞬簡PDF 変換 2024
PDFをOffice文書へ高精度変換


HTML on Word
WebページをWordで作る!

Next Generation PDF について(2)

Core concepts and use cases

キーノートでは詳しいことが分からなかったので、このセッションのスライドを読んでみました。

ここでは「next-generation PDF」を処理する「next-generation processor」という用語が出てきます。その役割は「タグ付きPDFからの導出(Derivation):PDF コンテンツを HTML で表現するための標準化されたモデル」と書かれています。
どうやら、HTML にうまく変換できるような標準化されたタグ付けのモデルとその変換アルゴリズムを定めて、予測可能で互換性のある方法で HTML に変換しよう、ということのようです。

そして、HTML に変換してから端末に応じたスタイルシートを適用することで、既にモバイル環境に対応した Web のテクノロジーを利用して、PDF のコンテンツをモバイル環境で利用できるようにする、という目論見のようです。

PDF から HTML に変換する製品は現時点でも既にあるようで、後のセッションでも紹介があります。標準化された方法でより正確に出来ることを目指そうということでしょうか。

また、ユースケースでは、アクセシビリティの観点からの解説がありました。

U.S. や EU 等の政府機関ではアクセシビリティが要求されますが、既存のスクリーンリーダーなどの Assistive Technology(障害を持つ人々を支援する機器や技術)は HTML をサポートするが、PDF はほとんどサポートされない状況があります。一方で PDF は電子文書としての信頼性と互換性が確立されているので、政府機関は PDF を諦めたくはない。

アクセシビリティの準拠基準は、W3C の WCAG (Web Content Accessibility Guidelines) 規格の達成基準レベル「AA」を条件として示されるようですが、この規格は Web を前提としたもので HTML には適用しやすいが、PDF には直接的に適用しにくいので、PDF が HTML として表現できれば WCAG への適合を判定しやすい、ということが説明されています。

今後 PDF がどのように発展していくのか。「PDF Day Europe 2017」での動向をご紹介しました。参考になれば幸いです。

<< その(1)




瞬簡PDF 作成 2024
ドラッグ&ドロップでPDF作成


アウトライナー
PDFを解析して しおり・目次を自動生成

Next Generation PDF について(1)

5月15, 16日にドイツのベルリンで開催されたイベント「PDF Day Europe 2017」のスライドやビデオが公開されていました。

https://www.pdfa.org/slides-and-video-recordings-of-the-pdf-days-europe-2017/

PDF2.0 の情報があれば見ておこうと思い Web サイトを訪れたのですが、「Next Generation PDF」という見慣れないワードを見つけました。最初は PDF2.0 のことかと思ったのですが違うようです。初日のキーノートと、3トラックのうち1トラックが「Next Generation PDF」に充てられています。気になり少し調べてみました。

KEYNOTE: Introducing Next-Generation PDF

スライドを見ると、最近のモバイル端末での PDF の閲覧や操作性の問題を課題としているようです。PDF は電子文書フォーマットとして広く普及していますが、モバイル端末環境となると閲覧や操作にかなり不満がありますね。特にスマートフォンでは閲覧するだけでも拡大縮小したり移動したりで大変です。PDF リーダーによっては実装されているリフロー表示もうまく使えないことが多いです。

モバイル端末しか使わないユーザーが急増する中で、Web の世界ではレスポンシブ web デザインやモバイルファースト等、積極的にモバイル環境への対応が進んでいますが、PDF もモバイル端末環境に対応すべく、イベントの主催者である PDF Association のテクニカルワーキンググループで「Next Generation PDF」なるものを検討している、ということのようです。

では「Next Generation PDF」とはどんなものなのか。スライドによると、

  • フル機能の PDF2.0
  • うまくタグ付けされた PDF

と書いてあります。PDF2.0 をベースにした規格になるのでしょうか。

「タグ付きPDF」は、例えば段落、表、ヘッダといった文書の構造情報を PDF に付加するための仕様です。PDF のページは単に文字や線や画像が並べられて見た目が構成されているだけなので、それらが段落、表、ヘッダなど何を表すのかプログラムは正確に判定できず推測するしかありません。そのため、スクリーンリーダーで正しい順序でテキストを読めない、PDF リーダーのテキストリフロー表示がうまくできないといったことが起こります。この問題は「タグ付きPDF」にすることでより正確にできるようになります。
「タグ付きPDF」は PDF1.4 から導入され ISO32000-1(PDF1.7)の仕様の一部ですが、PDF2.0 で見直されることになっています。

キーノートはここまででした。詳しくはあとのセッションでということです。
明日は「Core concepts and use cases」を読んでみたいと思います。

その(2) >>




瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識


HTML on Word
WebページをWordで作る!

PDF を Word や Excel に変換!PDF 変換機能をアプリケーションに簡単に組み込むライブラリのご紹介(1)

弊社のパッケージ製品 『瞬簡PDF 変換 9』 は、PDF を Microsoft Office Word、Excel、PowerPoint の各文書形式に変換することで PDF の再利用を可能とし、たいへんご好評をいただいております。

この変換機能をソフトウェアベンダー様が自社のアプリケーションに組み込んで利用できるライブラリとして提供するのが、『Antenna House PDF to Office 変換ライブラリ Ver.1.2.0』(以下、本ライブラリ)です。

本ライブラリで提供する機能は、PDF ファイル(Ver.1.3 – Ver.1.7)を入力して、Microsoft Word(doc/docx)、Excel(xls/xlsx)、PowerPoint(ppt/pptx)の各形式で別ファイルに保存するものです。

 

PDF to Office 処理概要

これまで、多くのソフトウェアベンダー様からご評価をいただき、PDF で配布されている積算資料や帳票類をExcelに変換するなど、主に土木・会計システムでご採用をいただいております。

本ライブラリに関する詳細は、『Antenna House PDF to Office 変換ライブラリ』 をご参照ください。
本ライブラリの価格・ライセンス条件等、詳しくは、oem@antenna.co.jp までお問い合わせください。

 ご紹介(2) >>




瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品!


瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識

PDFのレイヤー

PDFには、レイヤーという便利な機能があります。
レイヤーは、PDFの内容をまとめて、表示を切り替えたり印刷を切り替えたりします。 Acrobatでは次のようなダイアログでコントロールします。

layer-dialog

AH Formatter には、このレイヤーを出力する機能があります。
今回は、PDFのレイヤーでの言語指定について取り上げます。

レイヤーで指定した言語は、どのように振る舞うのでしょうか。
仕様では次のように書かれています(PDF 32000-1:2008)。

Language dictionary (Optional) A dictionary specifying the language of the content controlled by this optional content group. It may contain the following two entries:

Lang (required) A text string that specifies a language and possibly a locale (see 14.9.2, “Natural Language Specification”). For example, es-MX represents Mexican Spanish.
Preferred (optional) A name whose values shall be either ON or OFF. Default value: OFF. it shall be used by conforming readers when there is a partial match but no exact match between the system language and the language strings in all usage dictionaries. See 8.11.4.4, “Usage and Usage Application Dictionaries” for more information.

Language については、次のようにも書かれています。

Language: This category shall allow the selection of content based on the language and locale of the application. If an exact match to the language and locale is found among the Lang entries of the optional content groups in the usage application dictionary’s OCGs list, all groups that have exact matches shall receive an ON recommendation. If no exact match is found, but a partial match is found (that is, the language matches but not the locale), all partially matching groups that have Preferred entries with a value of ON shall receive an ON recommendation. All other groups shall receive an OFF recommendation.

PDFに指定されたLanguageは、アプリケーションの言語と地域に基づくと書かれています。アプリケーションとは、PDFのビューア、例えばAcrobatのことです。アプリケーションがレイヤーをサポートしていなければ、もちろん何も起こりません。Acrobatはサポートしています。

PDFに、日本語用のレイヤーと英語用のレイヤーを用意しておけば、アプリケーションの言語によって自動的に一方が表示され、他方が表示されないということができます。では、アプリケーションの言語とは何でしょう。仕様書中でそのことについて書かれている部分はありません。
そこで、どうすれば言語によるコントロールが意図どおりにできるのかを、Acrobatを用いて、試行錯誤を交えながらいろいろ探ってみました。

PDFには、Catalog辞書に言語を明示することができます。これは、文書のプロパティで確認することができます。AH Formatter では、<fo:root> に記述した言語がそこに反映されます。

<fo:root ... xml:lang="ja" ...>

property-dialog

アプリケーションの言語とは、これのことでしょうか。
いいえ、この言語はレイヤーの言語とは関係ありません。
これは、PDFの言語であってアプリケーションの言語ではありません。
アプリケーションの言語とは、Acrobatでは環境設定の言語環境にあるアプリケーションを表示する言語に対応することがわかりました。

lang-env

では、アプリケーションの言語は、具体的にはどう表記されているのでしょうか。14.9.2.2 Language Identifiers には次のような記述があります。

A language identifier shall either be the empty text string, to indicate that the language is unknown, or a Language-Tag as defined in RFC 3066, Tags for the Identification of Languages.

Although language codes are commonly represented using lowercase letters and country codes are commonly represented using uppercase letters, all tags shall be treated as case insensitive.

ざっくり言えば、PDFに書かれるLangの値は、RFC 3066 に従っていて大文字小文字は区別しない、ということです。RFC 3066 の言語コードは ISO 639、国コードは ISO 3166 によります。アプリケーションの言語も、ISO 639 と ISO 3166 で表現されているはずです。
実際にAcrobatでアプリケーションを表示する言語を変更すると、どこにどういう情報が書かれるのかはわかりませんでした。しかし、日本語なら ja とか ja-JP などが設定されると、常識的には予想するでしょう。

Preferredを指定していないと、Langに指定したものとアプリケーションの言語の間では完全一致性が判断されることになっています。そこで、日本語環境のとき、どういう指定をしたら完全一致するのかを調べました。

  • ja ⇒ NG
  • jpn ⇒ NG
  • ja-JP ⇒ NG
  • jpn-JP ⇒ NG
  • jpn-JPN ⇒ NG
  • ja_JP ⇒ NG
  • jpn_JP ⇒ NG
  • jpn_JPN ⇒ NG
  • ja-jp ⇒ OK

結果は、まったく想定外でした。仕様には大文字小文字区別しないと明記してあるし、国コードは大文字で表記するのが普通とも明記されています。これはどういうことでしょうか。Acrobatは仕様どおりに動作しているようには見えません。Acrobatの不具合なんでしょうか。仕様の見落としがあるのでしょうか。

完全一致させるのにこんな試行錯誤した上、それが正しいのかどうか裏づけも取れないのでは、完全一致を使うのは現実的ではない気がします。Preferredを指定すると、かなりあいまいな指定でもマッチします。
日本語は、それを話す国は日本しかないですが、英語やポルトガル語スペイン語などはそんなことはありません。例えば、en-US(米国英語)と en-GB(英国英語)を区別したいこともあるはずです。Preferredでは、それらを区別させることはできませんでした。どちらもすべての en にマッチしてしまうようです。つまり、国コードを明示したいなら、Preferredを指定できないということになります。

次に Preferred な ja と、そうでない ja-jp の指定を混在させたらどうなるか見てみます。
日本語環境ではどちらも表示されそうなものですが、ja-jp の方だけ表示されて、ja は表示されません。完全一致するものが見つかったらそれしか表示されない、ということになっているからのようです。このことは、en-US と en-GB を用意し、両者の共通部分を en として表現したくても、できないということを意味します。

AH Formatter V6.4 では、次のようにレイヤーへの言語指定を行ないます。
実際には重なり合った領域に内容を配置するでしょうから、<fo:block-container> などを利用することになります。

<?xml version="1.0"?>
<fo:root xmlns:fo="http://www.w3.org/1999/XSL/Format"
         xmlns:axf="http://www.antennahouse.com/names/XSL/Extensions"
         axf:layer-settings="'Japanese layer' lang 'ja' preferred,
                             'English layer' lang 'en' preferred">
...
<fo:block axf:layer="'Japanese layer'">
こんにちは
</fo:block>
...
<fo:block axf:layer="'English layer'">
Hello
</fo:block>
...

AH Formatter V6.4 MR3 以降を利用してください。

 




瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品!


瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識
Pages: Prev 1 2 3 4 5 6 7 8 9 10 ... 17 18 19 Next