『瞬簡PDF 変換』の変換以外の機能を紹介していますが、
今回、第2回目は「テキストの抽出」機能です。
PDFファイルに入っている文字だけを再利用したい。
そんな場合に便利なのが『瞬簡PDF 変換』の抽出機能です。
抽出元となるPDFが、テキスト情報が格納されているPDFの場合、
『瞬簡PDF 変換』の操作画面の上部に並んでいるアイコンから
「抽出」のアイコンを選択すると、
画面中央の抽出ファイルに「テキストを抽出(.txt)」が
選択できるようになります。
この状態で「実行」ボタンをクリックすると
PDF内に格納されているテキストデータのみを取り出して
テキストファイルとして出力することができます。
また、スキャナなどで作成した、画像データのみが格納され
文字情報が入っていないPDFの場合は、
『瞬簡PDF 変換』の操作画面の上部に並んでいるアイコンから
「OCR」のアイコンを選択してください。
すると、画面中央の抽出ファイルに「OCR結果をテキストとして出力(.txt)」が
選択できるようになりますので、選択して実行を行うと、
OCRがPDF内の画像を読み取り、読み取った結果の文字を
テキストファイルとして出力します。
なお、抽出前に設定を行うことで、抽出するテキストファイルの
文字コードも指定可能となっています。
是非一度お試しください。