Office 文書を PDF に変換した際、作成した環境では大丈夫だったのにPDF Server を使って PDF に変換すると文字化けが生じるとのお問い合わせを頂き、調べてみた所、興味深い結果が得られました。
ユーザーからの報告では、文書中でフォント「Times New Roman」が指定されていた「※(U+203B)」が PDF ファイル上では「□」と出力されていました。
そこで、調べてみるとこのフォント「Times New Roman」は、使用している Windows 環境によって、インストールされているフォントのバージョンが異なり、そのバージョンによっては文字コードに対応する字形を持たないものがあることが確認できました。
『Antenna House PDF Tool API』(PDF Tool API)は、PDFファイルの情報取得やPDFファイルの加工・編集を行うライブラリです。
PDFに関するさまざまな処理機能を搭載しています。
文書情報やページ数などの情報取得、ページの挿入や削除、透かしの挿入、セキュリティ設定などのファイル加工、ページコンテンツのテキストや画像の削除、画像の最適化(ダウンサンプリング)といったページ編集処理が可能です。
2018年 5月 9日から 3日間の日程で開催される「第 27 回ソフトウェア&アプリ開発展」(通称 SODEC ) にアンテナハウスは今年も出展致します。
この中で、『Antenna House PDF Tool API』(PDF Tool API)をブラウザから呼び出して利用するデモを展示しております。
サーバ側には、サーブレット・コンテナ(Tomcat)、PDF Tool API の Linux(64bit)版一式をインストールしてあります。
クライアント側は、ブラウザとなります。
『Antenna House PDF Tool API』(PDF Tool API)は、PDFファイルの情報取得やPDFファイルの加工・編集を行うライブラリです。PDFに関するさまざまな処理機能を搭載しています。
文書情報やページ数などの情報取得、ページの挿入や削除、透かしの挿入、セキュリティ設定などのファイル加工、ページコンテンツのテキストや画像の削除、画像の最適化(ダウンサンプリング)といったページ編集処理が可能です。
2018年 5月 9日から 3日間の日程で開催される「第 27 回ソフトウェア&アプリ開発展」(通称 SODEC ) にアンテナハウスは今年も出展致します。
この中で、『Antenna House PDF Tool API』(PDF Tool API)をブラウザから呼び出して利用するデモを展示しております。
サーバ側には、サーブレット・コンテナ(Tomcat)、PDF Tool API の Linux(64bit)版一式をインストールしてあります。
クライアント側は、ブラウザとなります。
トップ画面
サイドバー
[PDFを選択]
PDFファイルをサーバへアップロードした後、ページの内容を表示します。
[out] [in]
表示倍率を変更します。
[prev] [next]
表示ページを変更します。
処理モード
テキスト取得、テキスト追加、イメージ追加、墨消し追加の4つのモードから選択できます。
[PDFを保存]
アップロードしたPDFと、編集内容から、PDF Tool API を使用して、新しくPDFを生成します。生成後にPDFのダウンロードとなります。
PDF Tool API により、アップロードされているPDFと、3つの領域の内容を使って、新しくPDFを生成します。
ダウンロードされた PDF のスクリーンショットです。
文字列「あいうえお」(少しわかりにくいですが)、イメージ「アンテナハウスのロゴ」、「墨消し領域」が反映されています。
墨消しの設定により、領域内にある文字列「じゃがいも」から「好みで」までの文字情報はPDFから削除されます。