作成者別アーカイブ: taishii

スイート・ツールのバインド編集

本日は、スイート・ツールのバインド編集についてご紹介いたします。
バインド編集機能は、サムネイルを使った視覚的な操作でPDFファイルの結合、PDFファイル内のページの並び替え、ページの追加、削除、回転等を行うことができます。
これらの操作は、作業スペースで行います。作業スペースは、上段にファイルアイコン、下段にサムネイルを表示します。
作業スペースの構成
作業スペースの構成全体

ページの入れ替え
作業スペースのサムネイルでページを選択(複数ページ指定可能)し、移動させたいところにドロップするだけでページの入れ替えができます。
2ページ目を6ページ目に移動させる例
2ページ目を6ページ目に移動させる例全体

ページの削除
作業スペースのサムネイルでページを選択(複数ページ指定可能)し、右クリックメニューからページの削除ができます。
3ページ目を削除する例
3ページ目を削除する例全体

ページの回転
ページの回転は、ページ全体を回転させる方法と、特定ページのみ回転させる方法があります。
ページ全体を回転させる場合は、作業スペースのファイルを選択して、「ページメニュー->回転」で回転させることができます。
特定ページのみの回転させる場合は、作業スペースのサムネイルで行います。ページの削除同様にページを選択し、右クリックメニューから回転を行うことができます。
4ページ目を回転させた例
4ページ目を回転させた例全体

ファイル同士の結合
ファイル同士の結合は、作業スペースで行います。
結合元ファイルの後ろにファイルを結合することができます。
以下は、「見積もり」というファイルに「見積もり条件」というファイルを結合するときの例です。
「見積もり」というファイルに「見積もり条件」というファイルを結合するときの例

その他の機能
白紙ページの挿入、ページサイズの変更が行えます。これらの機能もすべて作業スペースで行います。

以上、スイート・ツールのバインド操作について簡単に紹介させていただきました。明日は、バインド操作したファイルに情報を追記する操作についてご紹介いたします。


スイート・ツールについて

今回から数回にわたり、スイート・ツールについて紹介させていただきます。
スイート・ツールとは、「アンテナハウス PDFスイート4.1」に同梱されている製品で、以下の機能を持ちます。

  • Office/一太郎文書からPDFへの自動変換
  • スキャナー連携で紙媒体をPDF変換
  • PDFのバインド編集
  • PDFへの追記
  • 更新された元文書を検出してPDFを更新
  • 印刷

PDFファイルの結合、ページの入れ替えを行いたい場合や、ページ番号など、ちょっとした文字列を追記したい場合に便利です。

本日は、スイート・ツールでファイルを取り込み編集操作を行うまでをご紹介します。
スイート・ツールは、WordやExcelなどPDF変換したいファイルをエクスプローラから原本リスト(起動画面の左上)に取り込むことから始めます。
エクスプローラから取り込みエクスプローラからの取り込み画面全体
WordやExcelなどのファイルを原本リストに登録すると自動的にPDF変換を行い、以下のように原本リストにファイルが登録されます。原本リストに登録されたファイル(原本ファイルという。)を選択すると、原本ファイルのサムネイル(起動画面左下)が表示されます。
原本リスト登録原本リスト登録イメージ画面全体
これで原本ファイルの登録は完了です。ただし、この状態ではまだ編集操作はできません。原本リストから編集したい原本ファイルを作業スペース(起動画面右上)にドロップした段階で初めて編集操作が可能となります。
原本ファイルをまるごと編集したい場合は、原本リストから作業スペースにドロップします。
原本ファイルの特定ページのみ編集したい場合は、原本ファイルのサムネイルから編集したいページを選択して作業スペースにドロップします。
また、作業スペースに取り込んだファイルのサムネイルから、作業スペースにドロップすることもできます。
作業スペースにドロップ作業スペースにドロップするイメージ画面全体

原本リストから作業スペースにドロップすると、さまざまな編集機能が使用できます。明日からは、作業スペースにドロップしたファイルを実際にどのように操作するのか代表的な機能についてご紹介してまいります。


CAS-UBの編集画面は、こんな感じ その2

 昨日に続き、クラウド型汎用書籍編集・制作サービス「CAS-UB」の編集画面について、簡単にお話しします。以下の画面は、今後も改良で変わることがあることを、ご了承願います。
 昨日は、CAS-UBで作られた電子書籍「はたらく人のための転職の実学」の「2.3 正しい転職チャンネルを選ぶ」を表示した画面をお見せしました。
 次のような画面でした。
CAS-UBの編集画面。個別部分CAS-UBの編集画面。個別部分
この文章を編集するときには、次の画面になります。
CAS-UBの編集画面。文章入力・編集CAS-UBの編集画面。文章入力・編集
 文章を表示していた部分が、ブラウザの編集フィールドに変わっていることにお気づきでしょうか。
 ここで、ブラウザで入力するように、文章を入れていけばいいわけです。
 その際、Wiki記法と呼ばれる書き方を使えば、見出しや箇条書き、文字サイズや文字の装飾といったことが、簡単にできます。そして、それはEPUBやPDFに反映されます。
 Wiki記法については、ネットに情報があふれているので、検索してみてください。
 CAS-UBでは、さらに便利になるように、標準的なWiki記法を拡張していますが、基本は標準的なWiki記法に準拠しているので、習得は容易です。
 Wiki記法はCAS-UBの特長の1つですが、別の大きな特長は、1つの本を複数の人で執筆できることです。しかもクラウド型なので、ブラウザさえあれば、遠く離れた人たちとも、一緒に本を書いてことができます。
 「はたらく人のための転職の実学」は、すでに販売を開始しています。詳しくは、
CAS-UBで制作した書籍「はたらく人のための転職の実学」をPDF版、EPUB版発売のご案内
をどうぞ。
 トレーニングセミナーのスケジュール、申し込み方法などは、
CAS-UB トレーニングセミナーのご案内
をご覧ください。
 CAS-UBについての詳しい説明は、
http://www.cas-ub.com/
をご覧ください。


CAS-UBの編集画面は、こんな感じ

 クラウド型汎用書籍編集・制作サービス「CAS-UB」の編集画面について、簡単にお話しします。以下の画面は、今後も改良で変わることがあることを、ご了承願います。
 CAS-UBにログインして、執筆中の本を選ぶと、次のような画面が出ます。
CAS-UBの編集画面。全体CAS-UBの編集画面。全体
 この画面は、CAS-UBで作られた最初の電子書籍「はたらく人のための転職の実学」を編集するときの画面です。
 縮小した画面で見づらくて恐縮ですが、上のほうに使える機能の一覧があります。
 左側は、本の目次に相当する部分です。いまは章に相当する部分が一覧に並んでいますが、節の部分に移動したのが、次の画面です。
CAS-UBの編集画面。節の部分CAS-UBの編集画面。節の部分
 これは、「2.3 正しい転職チャンネルを選ぶ」を表示したものです
 左上に、本の章・節といった構成がツリー構造で表示されています。このツリー構造を使って、本の中のあちこちに飛んで行って、文章を編集したり、章や節を追加・削除したりできるわけです。
 画面右側の「正しい転職チャンネルを選ぶ」以下は、実際にCAS-UBで入力された文章が表示されています。
 「はたらく人のための転職の実学」は、すでに販売を開始しています。詳しくは、
CAS-UBで制作した書籍「はたらく人のための転職の実学」をPDF版、EPUB版発売のご案内
をどうぞ。
 トレーニングセミナーのスケジュール、申し込み方法などは、
CAS-UB トレーニングセミナーのご案内
をご覧ください。
 CAS-UBについての詳しい説明は、
http://www.cas-ub.com/
をご覧ください。


CAS-UBのセミナーを開催します

 先日、発表会でお披露目したクラウド型汎用書籍編集・制作サービス「CAS-UB」。
 8月からは、実際に体験して、EPUB, PDFといった電子書籍を作るハンズオンのトレーニングセミナーを開催します。
 CAS-UBを実際に使いながら、本の編集、制作を行っていただきます。
 場所が狭いので、各回、5名と少なくて恐縮ですが、人気が出てくれば、もっと広い場所で開催したいと思っています。
 スケジュール、申し込み方法など、詳しくは、
CAS-UB トレーニングセミナーのご案内
をご覧ください。
 すでに、CAS-UBで作られた電子書籍「はたらく人のための転職の実学」も販売されています。
 詳しくは、
CAS-UBで制作した書籍「はたらく人のための転職の実学」をPDF版、EPUB版発売のご案内
をどうぞ。
 CAS-UBについての詳しい説明は、
http://www.cas-ub.com/
をご覧ください。


クラウド型汎用書籍編集・制作サービス CAS-UBを発表

 昨日、クラウド型汎用書籍編集・制作サービス CAS-UBの発表会を開催し、正式に発表させていただきました。
 開発チームの面々は、無事、終了するかどうか戦々恐々でしたが、大きなトラブルもなく一安心でした。
 CAS-UBは、ブラウザさえあれば、文章を書いて、EPUBやPDFの本を作れるクラウド型のサービスです。
 Wiki(ウィキ)という、ネットでは有名なサービスで使われる書き方を使っています。
 Wiki記法を使うと、見出しや箇条書き、文字サイズや文字の装飾といった、HTMLでできることが、HTMLより簡単に書けるようになっています。
 CAS-UBでは、入力した1つの文章から、EPUBとPDFのどちらの形式の電子書籍でも作れるようになっています。
 文章を書いて保存しておけば、何度でもEPUBやPDFを作ることができます。
 すでに、CAS-UBで作られた電子書籍も販売されています。
 詳しくは、
CAS-UBで制作した書籍「はたらく人のための転職の実学」をPDF版、EPUB版発売のご案内
をどうぞ。
 まだまだよちよち歩きのシステムですが、今後はどんどん発展させていくつもりです。
 ご意見を賜りたいと思います。
 CAS-UBについての詳しい説明は、
http://www.cas-ub.com/
をご覧ください。


PDFをWordやExcelで再編集!! グラフのはずが表に変換!?

本日は、瞬簡/リッチテキストPDF6.1の裏技的な機能についてお話したいと思います。
以下は、棒グラフが配置されたPDFの例です。
(画像をクリックすると、拡大ポップアップ表示されます)
グラフが配置されたPDF
[出典:外務省NGO支援策に関する調査結果報告(概要)2003年3月28日]
これを既定値でWordに変換してみると、下記のように「何だコリャ!?」という結果になってしまいました。
既定値でWordに変換
この場合、PDFの中身を見るとグラフの目盛り線は単に水平線の集まりで定義されているだけであるため、変換エンジンはこれを優先的に表
として処理するように判断し、このような変換になってしまいました。
それにしても、これでは困ってしまいますね。
こんなとき、瞬簡/リッチテキストPDF6.1の詳細設定機能を使うと、PDFでレイアウトが崩れてしまう場所を画像にして変換する指定ができます。
まず、瞬簡/リッチテキストPDF6.1で変換するPDFを指定します。
次に、以下の○印のところにあるボタンをクリックします。
詳細設定機能
すると下記のような設定画面が表示されます。
設定画面
ここから、(1)画像にしたい図があるページに移動し、(2)[画像変換の指定]タブを選択して、(3)表示されたページで画像にする範囲をマウスで選択後、(4)設定を保存して閉じる、という操作を行います。
この後に、再度先ほどのPDFを変換すると、Wordでは以下のような変換結果になります。

いったんこのように変換しておくことで、図を編集しなおす時間を短縮することが可能になります。
可能になります。
さて、短い間でしたが、瞬簡/リッチテキストPDF6.1に関するお話しにおつきあいいただき、ありがとうございました。
これからもお客様のお役に立てる製品開発と改善をたゆまず続けていく所存です。どうぞよろしくお願いいたします。


PDFをWordで再編集!! 段組みとテキストボックス、どちらを選ぶ?

PDFをWordで編集しなおしたいと考えますと、できるだけ元の体裁を再現して取り込むことができれば、編集にかかる手間も時間も削減できて便利です。

PDFを再度Wordに戻す場合、手っ取り早くレイアウトを再現するためにWordのテキストボックスに変換する方法があります。
Wordのテキストボックスは、ページ上に四角い枠を座標で配置できますから、その中にテキストを流しこめばレイアウトも比較的簡単に再現できます。
以下は、2段組みされたPDFをテキストボックスでWordに変換した例です。

(画像をクリックすると、拡大ポップアップ表示されます)
[元のPDF]
元のPDF
[テキストボックスでWordに変換した結果]
テキストボックスでWordに変換した結果

実際にこのような変換方法を既定値とする変換ソフトは、OCR変換型に多いようです。OCR処理ではページ上で文字列や表のある場所を最初に「領域」と呼ぶ矩形範囲でとらえてから文字認識を行うのが一般的で、「領域」をそのままテキストボックスに置き換えれば変換処理は比較的容易に行えるだろうと推測されます。
実は、瞬簡/リッチテキストPDF6.1でも、DTPソフトで作成したPDFなどレイアウトが複雑な文書をWordに再現するため、変換条件で「レイアウトを優先する」オプションを設けて、選択された場合にはテキストボックスを使用した変換ができるようにしています。

しかし、テキストボックスに頼る変換は、Word上での編集しやすさをスポイルしてしまいます。例えば、本文が横書き2段組みで構成されている文書が左右別々のテキストボックスで変換された場合、左側の段落で文字を削除したり追加したりしても右側の段落には何も影響しませんから、全体で体裁を整えるのがとても大変になってしまいます。
このようなことから、瞬簡/リッチテキストPDF6.1では、段組みを段組みとしてWordの本文に再現できるようこだわりを持って変換を行っています。
以下は、上記のPDFを既定値でWordの本文に変換した結果です。

[既定値でWordの本文に変換]
既定値でWordの本文に変換

このような変換だと、段落の文字列はひとつながりで編集できますから、修正も行いやすいですね。
レイアウトの再現は、PDFの情報だけが頼りであるためうまくいかない場合もあり、何年製品を作り続けていても「道半ば」なのですが、この先も変換後の編集しやすさを心がけて、改善を続けていきたいと思います。

なお、その他の変換例につきましては、瞬簡/リッチテキストPDF6.1の変換例のところをご覧になってみてください。

次回は瞬簡/リッチテキストPDF6.1の裏技についてお話しします。


PDFをWordやExcelで再編集!! 画像PDFはここにご注意

最近は、スマートフォンやiPadなどの普及で電子書籍が注目され、「自炊」という新語?もすっかり定着してスキャナに関する関心も高まっているようですね。

さて、スキャナで作成したPDFはご存じの通り文字が画像化したデータになりますから、そのままでは再利用の役に立ちません。これを活用するためには画像化された文字をテキスト編集できる文字コードの並びに置き換えてやる必要があります。

そこで登場するのがOCR機能です。
OCRでは、点の集まりである画像データから文字とおぼしき部分を抽出して、あらかじめ登録された文字パターンと照合するという作業をします。このことから、文字認識の精度は元画像の画質(画像の粗さ)やレイアウトの複雑さなどの要素に大きく影響されます。

画質が良いかどうかをOCRでは解像度(dpi)という尺度で測ります。
これは画像のきめ細かさを示すもので、値が大きいほど画質は良くなりますが、その分サイズも大きくなります。ちなみにOCRに適した解像度は300~400dpi程度といわれています。これ以下だと誤認識が多くなるようです。また、400dpi以上では認識精度はあまり変わらず、逆にサイズが大きくなることで読み取りに時間がかかってしまいます。

下記は、同じ書類を解像度を変えてスキャンし、OCR処理した結果例です。
(画像をクリックすると拡大ポップアップ表示されます)
[元のPDF]
元のPDF
[150dpi でスキャンしたPDFからWordへ変換]
150dpi でスキャンしたPDFからWordへ変換
[300dpi でスキャンしたPDFからWordへ変換]
300dpi でスキャンしたPDFからWordへ変換
スキャンした際の解像度が低いと文字の誤認識が起こりやすいことがおわかりいただけると思います。

画像PDFをOCR処理する場合の注意事項につきましては、瞬簡/リッチテキストPDF6.1のOCRを使用した変換についてもご参照ください。

次回は、PDFをWordに変換する場合に選択できるオプションについてお話ししたいと思います。


PDFをWordやExcelで再編集!! テキストPDFなのに文字化け!?

今日は、PDFをWordやExcelに変換する場合に、複合型(内部解析変換+OCR変換)の変換方法がお役に立ちます、というお話をさせていただきます。

PDFをWordやExcelに変換して再編集可能にするツール、瞬簡/リッチテキストPDF6.1のお客様からお寄せいただくご質問の中で、画像データでないPDFを変換したのに文字化けしてしまった、というご報告がときどきあります。

例えば、以下のようにPDFではテキストがしっかり表示されているのに、Wordに変換したら見事に文字化けしてしまった!!というケースです。
文字化けの変換結果

PDFに文字データが含まれるかどうかは、Adobe Reader などのPDF表示ソフトでPDFを開いて、編集メニューなどからすべてのテキストを選択(Adobe ReaderではCtrl+A のキー操作でも可)してみると手っ取り早く確認できます。
上記のサンプルでもテキスト部分がハイライトで表示されているのがお分かりになるかと思います。

さて、これはなぜでしょうか?
理由はPDFの作成方法にあります。
PDFを作成する場合、文字の情報をPDFに格納する方法として以下のふた通りがあります。

  • 文字コードをPDFに直接格納する。
  • 文字の形状(グリフ)をPDFに埋め込む。

前者は、文字を識別する固有のコード(シフトJISやUnicodeなど)をそのままPDFに格納するもので、PDFから文字を取り出すのも容易ですが、PDFを作成した環境とPDFを表示する環境で使用できるフォントファイルに違いがあると、PDFの見た目が違ってしまう場合があります。

後者は、文字を形づくる輪郭線をデータとして埋め込むもので、どの環境でPDFを開いても同じ見た目で表示されることを目的にしたものです。
一般にはフォント埋め込みされたPDFといいますが、文字の見た目が保証されるので表示する分にはまったく問題ありません。しかし、内部の文字を取り出す場合には文字の形の情報だけでは不十分で、文字の形から文字コードを引き出すための対照表データが必要となります。これがないと、WordやExcelなどのアプリケーションに文字データを正しく渡すことができないのです。

文字コード対照表をPDFに用意するのは、PDFを作成する側のソフトウェアの責任です。ただし、PDFの仕様上、この表を用意するのは必須とされていません。このためこれを省いてPDFを作成するケースが結構多いのです。

ここでようやく本題です。
文字コードを引き出すための対照表データがないPDFをWordやExcelに変換しても文字化けするばかりでは、PDFに文字は見えているのに再利用できないというジレンマに落とされてしまいます。
このとき、OCR機能が用意された複合型変換ソフトがお役に立ちます。
OCR機能は、PDFをいったん画像に変換してから文字の認識処理を行いますので、PDFに文字データがなくても文字を取り出すことができるわけです。
以下は、瞬簡/リッチテキストPDF6.1のOCR機能を使用して先ほどのPDFを変換し直した結果です。

OCRの変換結果
これなら、少しの手直しで再利用できそうですね。
PDF逆変換ソフトではOCR機能がお役に立ちますというところで、次回もう少しそのあたりの詳しいお話しをしてみたいと思います。

なおPDFのフォント埋め込みに関する詳細は、
コンピュータによるテキスト表記とPDFのフォント埋め込みについて
日本語の文字についての用語について(9) ? PDFへのフォント埋め込みとは
などの記事をご参照ください。


Pages: Prev 1 2 3 4 5 6 7 8 9 10 11 12 13 Next