瞬簡PDF 変換の便利機能 -その2-

『瞬簡PDF 変換』の変換以外の機能を紹介していますが、
今回、第2回目は「テキストの抽出」機能です。

PDFファイルに入っている文字だけを再利用したい。
そんな場合に便利なのが『瞬簡PDF 変換』の抽出機能です。

抽出元となるPDFが、テキスト情報が格納されているPDFの場合、
『瞬簡PDF 変換』の操作画面の上部に並んでいるアイコンから
「抽出」のアイコンを選択すると、
画面中央の抽出ファイルに「テキストを抽出(.txt)」が
選択できるようになります。

テキストの抽出

テキストの抽出

この状態で「実行」ボタンをクリックすると
PDF内に格納されているテキストデータのみを取り出して
テキストファイルとして出力することができます。

また、スキャナなどで作成した、画像データのみが格納され
文字情報が入っていないPDFの場合は、
『瞬簡PDF 変換』の操作画面の上部に並んでいるアイコンから
「OCR」のアイコンを選択してください。

OCRを使ったテキストの抽出

OCRを使ったテキストの抽出

すると、画面中央の抽出ファイルに「OCR結果をテキストとして出力(.txt)」が
選択できるようになりますので、選択して実行を行うと、
OCRがPDF内の画像を読み取り、読み取った結果の文字を
テキストファイルとして出力します。

なお、抽出前に設定を行うことで、抽出するテキストファイルの
文字コードも指定可能となっています。

是非一度お試しください。