カテゴリー別アーカイブ: コラム

瞬簡PDF 変換の便利機能 -その2-

『瞬簡PDF 変換』の変換以外の機能を紹介していますが、
今回、第2回目は「テキストの抽出」機能です。

PDFファイルに入っている文字だけを再利用したい。
そんな場合に便利なのが『瞬簡PDF 変換』の抽出機能です。

抽出元となるPDFが、テキスト情報が格納されているPDFの場合、
『瞬簡PDF 変換』の操作画面の上部に並んでいるアイコンから
「抽出」のアイコンを選択すると、
画面中央の抽出ファイルに「テキストを抽出(.txt)」が
選択できるようになります。

テキストの抽出

テキストの抽出

この状態で「実行」ボタンをクリックすると
PDF内に格納されているテキストデータのみを取り出して
テキストファイルとして出力することができます。

また、スキャナなどで作成した、画像データのみが格納され
文字情報が入っていないPDFの場合は、
『瞬簡PDF 変換』の操作画面の上部に並んでいるアイコンから
「OCR」のアイコンを選択してください。

OCRを使ったテキストの抽出

OCRを使ったテキストの抽出

すると、画面中央の抽出ファイルに「OCR結果をテキストとして出力(.txt)」が
選択できるようになりますので、選択して実行を行うと、
OCRがPDF内の画像を読み取り、読み取った結果の文字を
テキストファイルとして出力します。

なお、抽出前に設定を行うことで、抽出するテキストファイルの
文字コードも指定可能となっています。

是非一度お試しください。




瞬簡PDF 作成 2024
ドラッグ&ドロップでPDF作成


瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識

PDFの色指定について(2)

前回、PDFのデバイスカラースペースの3種類について説明しました。これらはその名前にある通りデバイスに依存したカラーの表現方法でした。そのため同じRGB値、あるいはCMYK値でも、デバイスが異なると違って見えることになります。同じ写真を2つの違うプリンタで印刷したり、同じ番組を違うテレビで見たり、といった身近なところでも経験することが多いかと思います。PDFの場合にあてはめれば、何か文書を作成してPDF化し、他の人にそのPDFを送って参照してもらうような場合に、作成した人が見ている画面と、送った先の人が見ている画面(あるいは印刷した紙)では別の色が表示されている、という現象になります。

このあたりを解決する、つまり異なるデバイス間で、同じカラー指定に対して同じ出力を行うことを目的としたカラースペースがCIEベースのカラースペースとなります。同じ出力といっても、当然ながら「そのデバイスの制限範囲内で」という制限がつきます。ディスプレイにしてもプリンタにしても、デバイスによって可能な色の再現範囲は異なりますので、その中で、指定に近い出力を得る(カラー値やカラースペースをどう調整しても、モノクロプリンタでカラー写真を印刷はできませんし)ことが目標となります。

前回記載したPDFで定義されている CIEベースカラースペース として、CalGray、CalRGB、Labおよび ICCBased の4種類を記載しました。これらのカラースペースの内容、指定されたカラー値を再現する方法の説明となるわけですが、PDFの仕様以前に、色とは何か、という非常にやっかいな説明が必要となってしまいます。わかる範囲で少し説明を試みてみたいと思います(デバイスカラースペースは、光の3原色、あるいは、プリンタのインクというような身近なところから、なんとなく理解できそうなので、色とは、などという説明抜きでなんとなく説明できましたが)。

おおざっぱにいえば、なんらかの光源から発した光が、物体にあたって反射し、人間の目に入り、人間がその物体の色として認識する、ということになります。赤いクルマといっても、太陽光の下で見る場合と、トンネル中の証明で見る場合と違うのは光源の発する光の性質が異なっていることによります。この光ですが、波としての性質を持つ、空中を伝わる振動エネルギーの束と考えることができるようです。波の性質として波長がありますが、高エネルギーの光の波長は短く(たとえば、X線では 1nm)、低エネルギーの光の波長は長く(ラジオの中波は100m~1km)なります。人間の目がとらえることができる可視光の波長は380nm~700nmのきわめて狭い領域ですが、この短波長側の光を紫、長波長側の光を赤として認識します。その外側がそれぞれ紫外線、赤外線と呼んだりします。また、虹などでは紫から赤までを適当に区切って7色と数えたりします。太陽光のような実際の光はいろいろな波長が混在した光です。可視光内で、緑の波長(国際照明委員会の規定では546.1nmだそうです)が多く含まれていれば緑、各波長の光が均等に含まれていると白と認識します。

ちょっと先走って、人間が赤とか紫とか認識すると書きましたが、人の目に入ってきた光は角膜、水晶体を通過して網膜にあたります。網膜上には光に反応する受容体として桿体、錐体というものが存在します。この錐体に可視光内の長波長(赤)に反応するもの、中波長(緑)に反応するもの、短波長(青)に反応するものがあり、それぞれの錐体がどのくらい反応するかで光の色を認識することになります。

色の話になってしまって、PDFのCIEベースカラースペースの話まで進めませんでした。こういう色というものをコンピュータ上でどう表現するか、さらにPDFではどう表現するか、また続きを記載したいと思います。

PDFの色指定について
PDFの色指定の概要・デバイスカラースペース
PDFの色指定 (3)CIE1931 CIELuv CIELAB
CIEカラースペース
PDFの色指定(4)
ICCプロファイル
PDEの色指定(5)CIEベースカラースペース
PDFのCIEベースカラースペース格納形式と使用のされ方の概略



HTML on Word
WebページをWordで作る!


アウトライナー
PDFを解析して しおり・目次を自動生成

oXygenシリーズ

弊社は今年1月より現在XMLエディタの中で最も勢いがあると思われるoXygenの販売を開始しました。JavaベースのアプリケーションですのでWindowsだけでなく、MacOSやLinux上でもお使いいただけます。

デフォルトでDITAやDocBook、MathMLなど数多くの形式(なんとFOも!)の入力をサポートしています。残念ながら学術論文用DTDのJATSには対応していないようです。しかし下のキャプチャのように
oxygen1
ファイルを新規作成するときにJATSのDTDを教えてあげると、そのままJATSエディタになってしまいます。

oxygen2

カーソル位置に入力できる要素の一覧であるとか、属性の一覧であるとかがリアルタイムに更新されます。まあ、XMLエディタなんだからそのくらい当り前だろうと言われてしまえばそのとおりなのですが、なんだかとても得した気分になります(笑)

XMLエディタをご検討中の方は、是非評価版を使ってみてください。

弊社の製品紹介ページ
https://www.antenna.co.jp/oxygen/

開発元(評価版はこちらから)
http://www.oxygenxml.com/

XMetaLについてはこちら
https://www.antenna.co.jp/xmetal/




瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識


瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品!

DITA Festa 2014 Osaka

毎年、年2回のペースで開催してきたDITA Festaですが、次回の会場はついに大阪です。3月19日~20日の2日間にわたって開催されます。過去のアンケートでも「関西方面での開催を希望」というご意見をいくつもいただいてきましたが、やっとご期待に応えることになりました。

今までは東京で開催してきましたが、毎回100名を超える参加申し込みがあります。今度の大阪でも多くの方からお申込みいただけると思いますが、定員が150名となっていますので、参加ご希望の方は早めにお手続きしてくださるようお願いいたします。

内容ですが、過去のFestaで行われたセッションの中から特に好評だったセッションを選りすぐったものを中心に、DITA初心者向けのセッションや導入事例などをバランスよく取り入れたメニューとなっています。すでにDITA導入に向けて動き出している方にも、これから勉強を始めようという方にもおすすめの内容だと思います。

詳しくは下記で案内されています。お申し込みもこちらからお願いします。
http://dita-jp.org/?page_id=1612




瞬簡PDF 編集 2024
かんたん操作でPDFを自由自在に編集


HTML on Word
WebページをWordで作る!

多言語索引ライブラリ I18n Index Library

アンテナハウスは2月6日 I18n Index LibraryV2.2をリリースしました。

DITA DocBookのコンテンツから多言語索引を作成するための多言語索引で海外では人気商品です。国内でもDITAの普及に伴い、主にグローバル企業より問い合わせが多く、ご利用いただくお客様が増えてまいりました。このライブラリをDITA OT (Open Toolkit)に組み込んで、PDF, HTML, EPUB プラグインと共にご利用いただけます。PDF5を使ってDITAからXSL-FOへの変換処理を行いAH Formatterで最終的にPDF出力を行います。

PDF5はアンテナハウスが DITA-OT用に開発したプラグインです。DITA 1.2のindex 機能をほとんど実装しており、こちら(http://dita-ot.github.io/)から入手可能です。

DITA-OTはDITAのパブリッシングで、トピックをマップに従って組み合わせたり、間接参照を解決したりなど大量の事前処理をするためのツールキットです。こちら(https://github.com/AntennaHouse/pdf5)から入手可能です。

pdf5

今回のV2.2では次の強化を行っています。

1. 10言語を正式にサポート

Arabic, Bulgarian, Greek, Hebrew, Indonesian, Malay, Romanian, Slovak,
Thai Vietnameseの言語を新たにサポートしました。これによって現在次の31
言語をサポートしています。

Arabic, Bulgarian, Catalan, Czech, Danish, German, Greek, English, Spanish, Finnish,
French, Hebrew, Hungarian, Indonesian, Italian, Japanese, Korean, Malay, Dutch, Norwegian,
Polish, Portuguese, Romanian, Russian, Slovak, Swedish, Thai, Turkish, Vietnamese,
Simplified Chinese, Traditional Chinese

2. 派生言語コードの定義が可能

例えば ポルトガルなら pt, pt-BR, pt-PTをインデックス構成ファイルに定義することができます。

3.I18n Index LibraryをDITA OTのプラグインとしてリリース

アンテナハウス(海外サイト)
http://www.antennahouse.com/

http://rainbowpdf.com/




HTML on Word
WebページをWordで作る!


アウトライナー
PDFを解析して しおり・目次を自動生成

「AH PDF Server V3」で作成したCAD図面のPDFは、ピンボケギザギザはありません。

前回記事の続きです。

 「AH PDF Server V3」のCADファイル変換ではCADソフトウェアを使用せずに変換を行うため、オフィスファイル(WordやExcelなど)の変換とは異なり、「AH PDF Driver」を利用しません。そのため、作成されたPDFは印刷データではなくCAD図面に基づくオブジェクトで構成されます。

 これはどういう事かと言えば、変換されたPDFを拡大しても斜めの線がギザギザになったり文字がぼやけたりしないという事を表します。

 このPDFに元のCADファイルを添付すると中身が簡単に確認出来て(CADソフトが必要ない)、もしも図面に修正が必要になっても元ファイルが一緒に存在するのでCAD図面のアーカイブに良いのですが、便利な反面注意点もあります。

 複雑な図面になればなるほどPDF上に沢山のオブジェクトが生成されます。そして図面をアーカイブするために結合して複数の図面を1つのPDFにした場合、図面によっては開いて表示されるまでの時間が非常に長くなるケースがあります。表示するコンピューターの性能も多少は関係してきますが、ページ送りも相当重く感じる事もあります。

 こういったケースは稀なんですが、それでもお問い合わせを頂いた中には何例かありました。

 前回も書きましたが、CAD図面というのは人それぞれという側面があります。そのためなかなか一筋縄ではいかない事も多々ありますが、そういう時こそご相談頂ければ一緒に解決の道を探す事も出来ます。

製品ページ:
AH PDF Server V3
AH PDF Server V3 CAD版

評価版お申込みページ

製品お問合せ:システム営業グループ
TEL:03-5829-9021  e-mail:sis@antenna.co.jp




瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品!


瞬簡PDF 変換 2024
PDFをOffice文書へ高精度変換

「AH PDF Server V3」におけるCAD変換とは?

「AH PDF Server V3」にはAutoCADやJW-CADのファイルをPDFなどに変換出来る「CAD版」があります。「CAD版」以外には別売の「CAD変換オプション」をご購入頂く事で「CAD版」と同じように変換が可能になります。

「AH PDF Server V3」のCAD変換は「AutoCAD」や「JW-CAD」のソフトウェアを使う事無くPDFやTIFFに変換する事が出来ます。ですので「AutoCAD」のファイルを大量に変換する場合などはソフトウェアを購入するよりも安価に導入できますし、CADソフトウェアを立ち上げない分、高速に変換が出来ます。

しかし、ここで注意が必要になります。

CADのデータは通常のグラフィックと異なり、「線」を書く事が主体です。また、尺度も大切な要素になってきます。フォントも専用のものが用意されていたりします。そのため、図面ファイル以外にフォントファイルや線の太さや印刷スタイルをなどを定義するファイルが必要な事が多いです。

私たちがテストをする時は割合「模範的」なファイルを用意して動作を確かめますが、現実には図面を作成する方の「クセ」が色濃く反映されているのがどちらかと言えば普通です。

大手企業ですと割合その辺のルールが決まっている事も多く、出力するとほぼ同じ設定できちんと出力される事が多いです。しかし、中小企業ですとその辺のルールもほぼ決まっていないためか、同じ設定でPDFに変換するとバラバラの結果になる事も珍しくありません。特に建築関係ですと、いろいろな会社の方が集まって1つの建物の図面を書いているのが当たり前ですので多種多様の設定の図面になってしまいます。

そのため、そういう図面を「AH PDF Server V3」で同じ変換設定で変換すると中には真っ白なもの(よく見るとかなり小さく出力されている)や、明らかに図面の一部が切れているものなどが出てきます。

一番効率が良いのは使用するフォントや印刷スタイル、レイヤ等の使い方を決めてしまい、そのルールに沿って図面を作成するようにする事です。これならまとめてPDFやTIFFに変換するのに効率が良いです。

それが出来ない場合は図面を書いている人毎にタスク設定と変換設定を作成して変換するのがおそらく一番効率的な方法になります。CADで図面を書かれる方はほとんどが自分のスタイルを確立していらっしゃいます。そのため、同じ人が作成したCADデータは同じ変換設定できちんと出力される可能性が高いです。

この辺は導入を考えていらっしゃるお客様からはまず質問や相談される内容になります。ここでは一例を挙げましたが、実際はお客様毎に解決方法が異なりますので悩んでいる場合は遠慮なくご相談して頂ければと思います。

製品詳細ページ:
AH PDF Server
AH PDF Server CAD版

製品お問合せ:システム営業グループ
TEL:03-5829-9021 e-mail:sis@antenna.co.jp




アウトライナー
PDFを解析して しおり・目次を自動生成


瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品!

書けまっせPDF バージョンアップ予告

使い始めると手放せなくなるとご好評いただいております「書けまっせPDF5」は、2014年4月にバージョンアップを予定しています。

今回のバージョンアップは、全機能をイチから見直して使いやすさを追求した上で新機能を追加しており、更によい製品になること間違いなしです。

4月には消費増税がありますが、ご安心ください。

3月31日までに、「書けまっせPDF5 プロフェッショナル」をご購入いただければ、新バージョンを無償でご提供します。今だけの特別価格でご提供しますので、今買うしかありませんね。

今だけのキャンペーン! まずは赤いバナーをクリックしましょう。

banner_kpd5201403Campaign




瞬簡PDF 作成 2024
ドラッグ&ドロップでPDF作成


瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品!

Formatter 販売開始から 13年

こんにちは。『AH Formatter』のサポート担当です。

弊社が『XSL Formatter V1』を販売開始してからこの春で 13年になります。
当時小学生だった息子が今は就職活動真っ最中です。
時の流れは早いものですね。
販売当初から関わってきた私の皺も増えました(笑)

今では電化製品などのマニュアルを見るとつい、
“Formatter で組めるかな”
“何のフォントを使ってるんだろう”
“禁則処理や均等割り付け出来てないとなんか気持ち悪い”
などと考えてしまい、すっかり職業病です。

ついこの前ははカーナビの取説のレイアウトにじっくり見入ってしまいました。
趣味の小説を読んでいてもつい、
“これ自動組版で全部可能だろうか”
なんて思ってしまうともう内容が頭に入ってきませんね、困ったものです。

『AH Formatter V5.0』から CSS 組版をサポートしてからもうすぐ 5年が経とうとしています。
最近、弊社サポートにも CSS 組版のお問い合わせが増えてきたなぁと実感しています。
今まで XSL-FO で運用してきたお客様の中にも、
簡単なものなら CSS 組版で出来るのではないかということで
検討を始めているというお話も耳にします。
弊社では、CSS 組版でここまでできる「ページ組版のための CSS 指南」の販売も行っております。
CSS 組版を検討されている方であれば、ぜひ御購入をお勧めします。

[書籍紹介] ページ組版のための CSS 指南




HTML on Word
WebページをWordで作る!


アウトライナー
PDFを解析して しおり・目次を自動生成

Server Based ConverterのWindows 8.1、Windows Server 2012 R2対応について

 Server Based Converterは、Microsoft Office, PDFなどのファイルを、PDF, Flash, SVG, 各種画像形式にダイレクトに変換する変換エンジンです。
 ダイレクト変換の意味は、たとえば、Microsoft Officeがない環境でも、ファイルさえあれば、それをダイレクトに内容を見える形式に変換できるのです。

 以前より、Server Based Converterは、Windows 8.1、Windows Server 2012 R2に対応するかというお問い合わせを頂戴しておりました。
 先般リリースいたしました、Server Based ConverterのV5.0 改訂3版(MR3)で、Windows 8.1、Windows Server 2012 R2に対応いたしました。

 なお、最新版以前のバージョンにつきましては、まことに勝手ながら動作保証の対象外とさせていただきたく存じます。
 どうしてもいう場合は、弊社にお問い合わせ下されば、善後策を協議することができると考えております。
 よろしくお願いいたします。

 Server Based Converterに関する詳しい情報は、
https://www.antenna.co.jp/sbc/
を、ぜひ、ご覧ください。
 評価版もご用意しております。
サーバベース・コンバーター 評価版のお申し込み
から、お申し込みください。

 アンテナハウスのシステム製品につきましては、事前に技術相談会を行っております。お気軽にお問い合わせください。
 詳しくは、
アンテナハウス システム製品技術相談会
をご覧の上、お申し込みください。




瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品!


瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識
Pages: Prev 1 2 3 ... 38 39 40 41 42 43 44 ... 111 112 113 Next