作成者別アーカイブ: AHEntry

無料のPDF編集ツールはどの程度使えるか―無料とは名ばかりのAdobe Acrobat Web

昨日検討したSmallpdf(無料のPDF編集ツールはどの程度使えるか―Smallpdfは無料で使える?)と類似した無料PDFツールにAdobe Acrobat Webがあります。

Adobe Acrobat Webは、WebブラウザでアップロードしたPDFやOffice文書などに対して、編集・変換処理を行うWebサービスです。トップページは次のように、機能がメニューとして用意されています。

メニューにリストされている機能を一覧表に整理すると次のようになります。

分類 機能リスト 概要説明
変換 PDFをWordに変換 PDFをMicrosoft Wordファイルに変換
PDFをExcelに変換 PDFをMicrosoft Excelファイルに変換
PDFをPPTに変換 PDFをMicrosoft PowerPointファイルに変換
PDFをJPGに変換 PDFをJPGその他の画像ファイルに変換
WordをPDFに変換 Microsoft WordファイルをPDFに変換
ExcelをPDFに変換 Microsoft ExcelファイルをPDFに変換
PPTをPDFに変換 Microsoft PowerPointファイルをPDFに変換
JPGをPDFに変換 JPGやその他の画像ファイルをPDFに変換
PNGをPDFに変換 PNGやその他の画像ファイルをPDFに変換
PDF変換ツール ファイルとPDFを変換
編集 PDFを編集 テキストボックス、コメント、ハイライトなどを追加
PDFを結合 複数のファイルをひとつのPDFに結合
PDFを分割 ファイルを複数のPDFに分割
PDFをトリミング ページコンテンツをトリミング、余白を調整、ページサイズを変更
PDFのページを削除 PDFからページを削除
PDFのページを回転 ページを左右に回転
ページの順序を入れ替える PDFのページの並び順を変更
PDFのページを抽出 選択したページで新しいPDFを作成
PDFにページを追加 PDFにページを挿入
PDFにページ番号を追加 PDFにページ番号を追加
ファイルサイズをコンパクトに PDFを圧縮 PDFのサイズを縮小して、簡単に共有
署名と保護 入力と署名 フォームに入力して署名を追加
電子サインを依頼 オンラインですばやく文書を送信して電子サインを依頼
PDFを保護 パスワードを設定してPDFを保護

「オンラインでAdobe Acrobatを活用」というキャッチから、デスクトップ製品であるAcrobatの機能をオンラインで使えるようにしたものという印象を受けます。しかし、メニューをざっと見たところではPDFとOffice同士の変換が充実しています。

Acrobat Webは実際に無料でどこまで使えるか。試してみると、最初の1回目はログインしないでも使えますが、2回目に使おうとするとログインが要求されます。さらに次は有料版の7日間試用の申込となり、支払い方法としてクレジットカードまたはPayPalの登録を要求されます。

2回目からは「無料で始める」というボタンを押しても、サブスクリプションの登録ページ(下図)が表示されるなど、どこまでが無料なのかが分かりにくい仕組みになっています。

調べてみるとヘルプページに次のようなQ&Aがありました。

Q 無料ツールは何回使用できますか。
A Adobe ID を使用して Acrobat web 版または Acrobat ブラウザー拡張機能にログインしない場合は、1 件の無料トランザクションの実行と、作成されたファイルの 1 回のダウンロードのみ可能になります。ログインしないと試せないツールもいくつかあります。

Adobe ID でログインすると、ファイルの入力、署名、共有、コメント追加を無料で行うことができます。ログイン時に他のプレミアムツールを試す場合、無料のユーザーには次の制限が適用されます。

他のプレミアムツールを試す場合は、30 日ごとに 1 件の無料トランザクションを繰り返し実行できます。例えば、任意の日に初めてログインし、「PDF を Word に変換」ツールを使用した場合、現在の 30 日間で 1 件の無料トランザクションを使用したことになります。15 日後に「PDF を圧縮」ツールにアクセスした場合、現在の 30 日間で無料トランザクションを既に消費しているため、このツールは使用できません。もう一度プレミアムツールを無料で使用するには、30 日間が終了するまでお待ちいただく必要があります。

電子サインを依頼するトランザクションには、追加の制限が適用される場合があります。

無料の上限に達すると、オンラインで通知されます。

(2024/5/22ヘルプページより引用)

整理すると
1.ログインしないで使えるのは1回だけ(但し、すべての機能が使えるわけではない)
2.ログインするとファイルの入力、署名、共有、コメント追加を無料で使える
3. それ以外の機能は、無料だと30日に1回だけ使える

この説明によると、ログインすれば、PDF編集機能のうちコメント機能は無料で使えるようです。しかし、試した範囲ではGoogleアカウントでログインしようとすると「Something went wrong」というメッセージが表示されてログインができませんでした。

ということでAcrobat Webを実際に無料で使えたのは1回のみでした。Acrobat Webの無料とは名ばかりと言わざるを得ませんね。

弊社の有償ツールとの比較

結局、Acrobat Webを実用的に使いたいならば、Acrobat Proの有料サブスクライブ契約するしかなさそうです。Acrobat Proは弊社製品で比較するならば『瞬簡PDF統合版』が機能的には一番近くなります。

契約体系が全く異なっているので価格は比較しにくいですが、次の表のとおり、5か月を超えて使用する予定があるなら『瞬簡PDF統合版』の方がお安くなります。

Acrobat Pro 瞬簡PDF統合版
シングルライセンス
契約方式 サブスクリプション 永続ライセンス
月々プラン 税込3,380円 パッケージ版
税込15,950円
ダウンロード版
税込14,190円
価格は値引きなし標準価格
値引きが適用されとさらにお安くなります。
年間プラン 税込23,760円
2年間使用 税込47,520円
3年間使用 税込71,280円

Acrobat Webは「無料」と銘打たれていても、無料で実用的に使うのはまず無理でしょう。本質的にサブスクリプションへの誘い込み手段に過ぎないものに「無料」と銘打つのはマーケティング手段として悪質というべきでしょう。


無料のPDF編集ツールはどの程度使えるか―Smallpdfは無料で使える?

Copilotに聞いてみました。

質問
無料のPDF編集ツールはどんなものがありますか

回答
もちろんです!PDFを編集するための無料のツールがいくつかあります。以下はいくつかのオプションです。

Smallpdf:
オンラインで直接使える無料のPDFエディターです。
テキストの編集や画像の追加、図形やハイライトの挿入などが簡単に行えます
<以下、略>

Copilotに限らず、無料のPDF編集ツ―ルとしてSmallpdfがよく挙げられます。Smallpdfは結構人気があるようです。そこでSmallpdfってどんなものなのかちょっと調べてみました。

まず、Webページです。Smallpdfのトップページはこちらです:
https://smallpdf.com/jp

画面右上で「ログイン」すると次のような画面になります。

メニューにリストされている機能を一覧表に整理すると次のようになります。

分類 機能リスト 概要説明
変換&圧縮 PDF 圧縮 PDFのサイズを縮小
PDFコンバーター Word、Excel、ppt、および画像ファイルがPDFに変換されます。PDFファイルは選択されたファイルタイプに変換されます。
PDFスキャナー PDFをモバイルでスキャン
整理 PDF 結合 PDFドキュメントをマージ
PDF 分割 ページずつ分割したり、特定のページを切り取って新しいPDFファイルを作成
PDFを回転 回転するページを選んだり、すべてのページを一度に回転
PDFページを削除 PDFからページを削除
PDFページの抽出 1つのPDFとしてページを抽出できます。また、選んだページごとに個別のPDFを作成することも
表示&編集 PDF編集 テキストや画像、ハイライト、描画の追加やドキュメントの整理
PDF注釈 注釈が追加されたPDFを透かしなしでエクスポートし、さまざまなファイル形式に変換したり、圧縮
PDFリーダー 自由に解析、編集、共有、印刷
ページ番号を付ける 各ページのヘッダーまたはフッターに自由にページ番号を付ける
AI PDF要約 50MBのファイルサイズと50,000ワードの文字数を上限に、PDFドキュメントをお好きな数だけ要約
PDFから変換 PDF Word 変換 PDFをワードファイルに変換
PDF Excel 変換 PDFファイルをExcelスプレッドシートにすばやく変換。OCRも可能
PDF PPT 変換 PDFをPPTファイルに変換
PDF JPEG 変換 「全てのページを変換」または「画像を1枚ずつ抽出」
PDFに変換 Word PDF 変換 DOCとDOCXを数秒以内にPDFに保存
Excel PDF 変換 xls/xlsxファイルをPDFに自動変換
PPT PDF 変換 PPT も新しい PPTX フォーマットもどちらも変換
JPEG PDF 変換 文字のサイズ、ページの向き、ページ余白を自由に調整
PDF OCR OCRなら、選択可能なテキストを含む検索可能なPDFを作成
署名&セキュリティ EサインPDF 署名と署名者を検証するためのLTV(長期検証)タイムスタンプが付与
PDF ロック解除 PDFからパスワードを解除
PDFを保護 PDFにパスワードを追加
PDFをフラット化する 内容がドキュメントに恒久的に埋め込まれる

ざっくりみると、PDF編集ツールとしてはかなり機能が充実しているように見えます。もう少し詳細なところは後ほどチェックすることにして、「価格」を見てみましょう。

価格には次の4つのメニューがあります。
①無料
②プロ(月額1,013円)
③チーム(月額825円)
④ビジネス(カスタム価格)

プロとチームは、それぞれ、7日間のトライアル期間があります。トライアル期間を開始するにあたっては、クレジットカード情報の登録が必要で、7日間の試用が終わると課金されることになります。

有償ツールのトライアル期間は無料ツールには含めないとすると、「①無料」でどこまで使えるかがチェックポイントとなります。実際に使ってみると、多くのメニューは確かに無料で使えますが、しかし、重要な制限があります。

1.無料で使用するとき「ダウンロード」の制限があります。今回試した範囲では二つのPDFファイルを作成してダウンロードできました。しかし、三つ目をダウンロードしようとしたら、もう1日の制限容量を超えてしまったということで、次の画面のメッセージがでてダウンロードできません。1日にたった2ファイルしかダウンロードできないのでは、少なくとも仕事には使えないでしょう。

2.メニューでは一通りの機能があるように見えます。しかし「PDF編集」の中の「テキストや画像、ハイライト、描画の追加」をみると、ほぼ注釈の編集機能です。PDF本文編集では、本文への「テキスト」の追加機能があります。これを使おうとすると、次のダイアログが表示されます。


どうやら、これはSmallpdf proの機能のため「無料」では使えないようです。

Smallpdfツールは機能がかなり充実していて魅力的を感じる点もあるサービスです。

しかし、上記の1、2の制約を考えると「無料のPDF編集ツール」かもしれませんが、Smallpdfを「無料で実用に使える」とは言えないでしょう。無料はPR効果を狙った宣伝用語に過ぎないといえそうです。

弊社の有償ツールとの比較

結局、PDF編集を実用的に使いこなそうとするならば、有料のSmallpdf Proを契約するしかなさそうです。Smallpdf Proは、弊社製品で比較するならば『瞬簡PDF統合版』が機能的には一番近くなります。

契約体系が全く異なっているので価格は比較しにくいですが、次の表のとおり、1年と少しを超えて使用する予定があるなら『瞬簡PDF統合版』の方がお安くなります。

無料という宣伝文句に踊らされないようにしっかり比較してみましょう。

Smallpdf pro 瞬簡PDF統合版
シングルライセンス
契約方式 サブスクリプション 永続ライセンス
月間利用料 非課税(?)1,013円 パッケージ版
税込15,950円
ダウンロード版
税込14,190円

価格は値引きなし標準価格
値引きが適用されとさらにお安くなります。
1年間使用 非課税(?)12,150円
2年間使用 非課税(?)24,300円
3年間使用 非課税(?)36,450円

【ご注意】Microsoft Copilotの回答は、ときどき、お頭が空っぽなオーム並みのことがあります

生成AIが注目されているので、Windows 11に付属しているCopilot無償版(プレビュー)に、いくつかPDF関係の質問をしてどんな回答が得られるか、どの程度役に立つのだろうかと少しばかり試してみました。

幾つか試してみたところ、質問の内容によっては参照元Webページの要約をまとめていることが明らかなケースがときどきあります。

この場合、参照元のWebページが誤っていると、Copilotはその内容の真偽を判断することなく、オーム返しに誤った回答をしています

例えば、

質問:フォント埋め込みの方法を教えてください。

Copilotの回答:

PDFファイルにフォントを埋め込む方法は、Adobe Acrobat Reader DCを使用して行うことができます。以下にWindowsとMacの両方の方法をご紹介します。

Windows(Adobe Acrobat Reader DCを使用)
Adobe Acrobat Reader DCを開きます。
(以下、省略)

この回答の中では、Acrobat Reader DCでPDFを表示して、そのPDFを「Adobe PDF」ドライバで印刷して新しいPDFを作る方法を説明しています。

これでは、Adobe Acrobat のプリンタドライバで新しくPDFを作り直しているのであって、Adobe Acrobat Reader でフォントを埋め込むとは到底言えないでしょう。

しかも「設定」の説明も誤っています。

Copilotが、このような本質的に誤った回答をしている原因は、この回答で参照しているWebページの内容が誤っていることにあるようです。

Copilotが、この回答で参照しているWebページは次の二つです。

[1] https://office-hack.com/pdf/font-embedding/
[2] https://pdf.wondershare.jp/pdf-edit/font-embed.html

この[1]には「Adobe Acrobat Reader DCでPDFにフォントを埋め込む方法」という説明文があり、Copilotはこの説明文をほぼそのままオーム返しに、自分自身の回答としています。今回の場合、かなり「引用」に近い状態です。

ここで大きな問題は、[1]の内容がまるでデタラメということです。結果的に、Copilotの回答もデタラメになっています。

本来は、Copilotは自分自身が蓄積した知識を使って、Webページの内容の真偽を判断し、情報の取捨選択をしたうえで、正しい情報のみを整理しないといけないはずです。しかし、現時点では、収集した情報の真偽の判断ができていないようです。

ある情報の真偽を判断するのは人間にとっても難しいものです。人間の場合は、例えば実際に行動して、その失敗から学んで正しい知識を身に着けていく場合も多いでしょう。しかし、CopilotのようなAIが、自らの行動の結果に基づいて学ぶということは簡単ではないかもしれませんね。


Google検索、PDF編集は「無料」にハックされているか?

昨日「Google 検索、劣化してない?」で、検索結果について「上位に来る記事は『無料』というキーワードがちりばめられたものばかり。無料というキーワードがないと記事としても認められないのだろうか?」とお話しました。この点をもう少し詳しくみてみます。

Googleで「PDF編集」というキーワードで検索し、ヒットしたページのタイトルとURLを上位から10位まで並べると次のようになります。(スポンサーとマークされたページは除外しています。)

タイトル URL
【無料】PDFの編集やコメントの追加 | Adobe Acrobat https://www.adobe.com/jp/acrobat/
online/pdf-editor.html
PDFを編集する方法を徹底解説!WordやExcelへの変換手順と無料でできるやり方を紹介 https://www.itreview.jp/labo/archives/8901
無料のPDFエディターとフォームフィラー。オンラインでPDFを編集 https://www.ilovepdf.com/ja/edit-pdf
PDFを編集 – ブラウザで直接使える無料PDFエディタ https://smallpdf.com/jp/edit-pdf
PDF編集のやり方!PDFとは?初心者向けに徹底解説 | コエテコキャンパス https://coeteco.jp/articles/11361
PDF を編集する – Microsoft サポート https://support.microsoft.com/ja-jp/
office/pdf-%E3%82%92%E7%B7%A8%E9%9B%
86%E3%81%99%E3%82%8B-b2d1d729-6b79-499a-
bcdb-233379c2f63a
【2023年最新】無料PDF編集ソフト10選オススメ https://pdf.wondershare.jp/ranking/
pdf-editor-top-10.html
PDFを編集 | Adobe Acrobat https://www.adobe.com/jp/acrobat/
how-to/pdf-editor-pdf-files.html
PDFは編集できるの?どうやって編集するの? https://www.antenna.co.jp/pdf/reference/
PDFEdit.html
PDF 編集 – 簡単、オンライン、無料 https://tools.pdf24.org/ja/edit-pdf

こうしてみると、上位10本の記事のなかで6本のタイトルに「無料」という言葉が含まれています。

「PDF編集」をGoogleで検索した結果は「無料」にハックされている、と言えるかもしれません。

ハックとは「システムで許容されているが、その設計者は意図も予想もしていなかったこと。」(『ハッキング思考 強者はいかにしてルールを歪めるのか、それを正すにはどうしたらいいのか』(ブルース・シュナイアー著、日経BP発行、2023年10月16日))


Google 検索、劣化してない?

最近のGoogle検索は広告のスペースが多すぎじゃないだろうか?
例えば「PDF編集」で検索すると、検索結果は次のように、PCの1画面分ほとんど広告が占有してしまう。

Webを検索した結果を知りたいのに、出てくるのは、検索の結果ではなくて、広告ばかり。
ちょっとひどすぎるのではないか? これでは検索機能の本来の目的を果たせていない、と思うのだけど。

しかも、上位に来る記事は「無料」というキーワードがちりばめられたものばかり。無料というキーワードがないと記事としても認められないのだろうか? 

Googleが登場したときの「Webページ間のリンクによって、ページランクを計算する。結果的に良質のWebページからのリンクが多いときページランクが高くなる。」という優れた着想はどこに行ってしまったのだろうか?


『AWSなどでMicrosoft製品(SPLAライセンス)が使えなくなる!?』ってホント??

2023年8月18日付けのIIJのエンタープライズIT Columns(JJI-ITCと略記)に、『AWSなどでMicrosoft製品(SPLAライセンス)が使えなくなる!? 』という記事が掲載されています。

だいぶ前の記事なのですが、「2025年9月30日以降、AWSやGoogle Cloudなどのパブリッククラウドを利用しているサービス提供事業者は、Microsoft製品(SPLAライセンス)の持ち込みができなくなる」とあるので、本当だとすると、結構インパクトが大きそうです。

現時点で1年半ほど先の話ですが、弊社でも関係するクラウドサービスを提供しているため調査を始めています。

マイクソロソフトのWebページで関連する情報を探すと、次の記事が見つかりました。
クラウドへのワークロードとライセンスの導入を容易にする、新たなライセンス特典(2022年9月12日)

この中の「アウトソーシングに関するSPLAプログラムのアップデート」と見出しのついた段落がJJI-ITCの記事で言っている内容に該当するようです。

この記事は次の元記事(英語)の翻訳とされています。
New licensing benefits make bringing workloads and licenses to partners’ clouds easier (2022年8月29日:元の記事を読むにはブラウザで言語を英語にする必要があります。)

この記事を読むと、マイクロソフトのSPLA(Services Provider Licensing Agreements)は、データセンターを運営する事業者とユーザーの間の契約を想定していた。しかし、マネージド・サービス・プロバイダーが、SPLA契約でマイクロソフト製品のライセンスを購入して、他社のデータセンターでサービスを行うようになった。これを元の意図に沿って正したいということのようです。

そこで、リストに該当するプロバイダーの上にSPLAを持ち込むことができないようにするという措置を講じるということです。

リストに該当するプロバイダーとは次のとおりです。
Alibaba, AWS (Amazon Web Service), Google, Microsoft およびサービスの一部としてこの4つのプロバイダを使ってアウトソースサービスを提供しているプロバイダ

英文の記事中で掲げられている対応策は
現在マイクロソフト製品をSPLAで利用しているパートナーは、2025年9月までに上記のリストに該当するプロバイダーから移行するか、上記のリストに該当するプロバイダーからライセンスをSPLAとは別に直接取得しなければならない
とされています。

この記事を読んで、よく行くTOHOの映画館で映画上映前にいつも出る「当館以外で購入された飲食物の持ち込みはご遠慮ください」という無粋な告知を思い浮かべてしまいました。

館内で販売されているやや高めの飲食物を買って楽しむか、上映中に飲食すること自体を諦めるか、どっちかの選択が必要になるということですかね。

もしかすると、弊社の『Office Server Document Converter』の出番がありますか?

【ご注意】本記事の詳細はさらに調査中です。(当社の主体の記事ではなく、解釈なので)誤っている可能性もありますのでご注意ください。


米国国債の利回り変化と国債価格の値動きを調べてみた

一般には、金利が上がると債券の価格は下がると言われている。では、金利のうごきと債券価格の動きは定量的にどのような関係になっているのだろうか。

債券運用の本を読んでみたところ、次のような説明があった。ここでは単純化するために利息(クーポン)の付かない割引債(ゼロクーポン債)の場合について示す。

割引債の価格(P)と複利最終利回り(r)には次の関係がなりたつ。

P=100/((1+r)^n) (n:残存年数)

これは価格Pの割引債を満期まで(n年)保有すると100で償還される。そのときの複利計算の利回りがrとなるということを表す式なので、割引債がデフォルトしない限り必ず成り立つ一種の定義式である。

上式の両辺をrで微分すると次のようになる。

dP/dr=-100n/((1+r)^(n+1))=-nP/(1+r)

これは次のように置き換えられる。

dP/P=-(n/(1+r))*dr

この式は残存n年の割引債の価格変化率(dP/P)は複利最終利回りの変化幅(dr)に対して、n/(1+r) 倍した値になるということを表している。

現在の米国30年国債の利回りは概ね4%強になっている。なので残存期間30年の米国割引国債を買って保有したとき、利回りが1%下落すると、価格は28%ほど上昇するということになる。

式の導出過程を振り返れば分かるとおり、上の関係は理論的なものだ。

実際には国債の価格は市場の需給関係で決まっていると言われている。自然界ではニュートンの万有引力の法則が成り立つとしても、魑魅魍魎が支配する証券業界で、こんな理論的関係が、あたかも万有引力の法則のように働くものなのだろうか。

俄かには信じがたいので、早速、楽天証券で米国30年ストリップ国債(残存期間25年3カ月)を少額だけ購入して実際の値動きを調べてみた。

1.楽天証券では評価額は毎日当日夕方の17時頃にわかる。
2.また別にQuick情報で米国30年国債の利回りを調べる。米国30年国債の利回り(終値)は翌日の朝にわかる。

1月16日から2月8日までのデータは次のとおりであった。

この結果を見ると、前日に国債利回りが上がっているときは、ストリップ国債の楽天の評価価格が下がり、逆に利回りが下がっているときは、ストリップ国債の評価価格が上がっている。

国債利回りの変化(drに相当)をx軸に、ストリップ国債の価格の変化率(dP/Pに相当。Pは前日の価格、dPは前日からの価格変化)をy軸にとって分布図にすると次のようになる。

Excelで回帰分析して、次の関係式を得た。xとyは1日ずれている。

y=-0.241x+0.001

これによると、利回りが1%下がると、価格は概ね24%アップする、という関係になる。

概ね、理論どおりの関係が成り立っているようだ。

実際には、前日の米国30年国債の利回り終値を見て、楽天証券が評価価格を計算しているのかもしれない。もし、そうなら観測値がほぼ直線上に並ぶはずなのだが。

「債券の価格と利回りはコインの裏表の関係にある。しかし、主従関係からみれば価格が主」という説明もあるが、債券の価格決定過程はブラックボックスなので、真実はわからない。

参考資料:『債券運用と投資戦略』(金融財政事情研究会)


DeepLによるHTML翻訳でタグが正しく取り扱われるか?

日本語の文章を英語に翻訳するためにツールとして、機械翻訳がかなりいいレベルまで来ているのは周知のとおりです。では、HTMLでタグ付けされたWebページの翻訳にも機械翻訳を使えるでしょうか?

HTMLファイル機械翻訳の課題

日本語HTMLファイルは大きくわけるとテキストコンテンツと画像やマークアップ(タグなど)から構成されます。

タグにはいろいろな種類があります[注1]。メタ情報を表すタグ、見出し、段落、箇条書き、表などのブロックの区別を表すタグ、強調、アンダーライン、上付き・下付きなどテキストの意味合いを表すインラインタグ、リンクや画像を埋め込むタグ、などです。

WebページのレイアウトはCSSで指定します。このため多くのタグに、CSSによるレイアウトを制御するための属性が付加されます。また、HTMLファイル内にはブラウザで表示する際のダイナミックな動作を表現するためにJavaScriptが埋め込まれます。このためHTMLファイルは、コンテントのテキストと比べてかなり複雑になり、通常はマークアップ作業に多大な時間がかかります。

機械翻訳のシステムでHTMLファイルを日本語から英語に翻訳するとき、(1)テキストコンテンツの翻訳の品質に関わる課題と、(2)タグの扱いが適切かどうかという課題があります。

タグの扱いについての要件

ここでは、主にタグの取り扱いを考えてみます。まず、タグの扱いは基本的には次の条件を満たす必要があります。

1.タグ自体は翻訳せず、タグのツリー構造は保持されなければならない。つまりタグの順序が変更されないこと。開始タグと終了タグの対が保持されること。タグの親子関係(入れ子関係)が崩れないことなどが満たされること。
2.開始タグには属性と属性値が付随することがあります。属性は翻訳せず、属性値は多くの場合、翻訳しない方が望ましいが、翻訳してほしいこともある。

日本語のHTMLファイルを機械翻訳した結果、タグのツリー構造が壊れてしまったり、マークアップが不適切になってしまうと、機械翻訳の出力として得られたHTMLファイルのタグ付けを修正する作業が必要になります。もし、タグの構造が完全に破壊されてしまうと、プレーンテキストにゼロからタグ付け作業をする方が手間が少ないということになります。

特に、インラインタグは翻訳テキスト中に混在するのでタグのツリー構造を維持するのが難しい場合がありそうです。そこで機械翻訳システムがテキストコンテントとタグを分離してうまく扱えるかどうかは詳しく調べてみる必要があります。

機械翻訳のHTMLファイル形式サポート

機械翻訳システムによってはタグでマークアップしたテキストを翻訳対象にできないことがあります。ここで使用するDeepLは、Free版ではHTML形式ファイルを扱えません。一方、Pro版とAPI版がHTMLファイル形式を翻訳対象としてサポートしています。

Which file formats can I translate?

DeepLによる日本語HTMLファイルの英語への翻訳例

そこで、今回、DeepLでHTMLを翻訳したときタグが正しく扱われるかを調べてみました。翻訳の対象としたのは、Formatter V7.4(開発中)の日本語HTMLマニュアル(XSL/CSS拡張)です。

Formatterのマニュアルは、日本語と英語版のWebヘルプとして作成されています。V7.3(現行バージョン)についてはこちらからご覧いただけます。現在、翻訳は社内の専門スタッフが行っており、機械翻訳は使っていません。
Antenna House Formatter V7 日本語版マニュアル
Antenna House Formatter V7 日本語版マニュアル・XSL/CSS拡張
Antenna House Formatter V7 英語版マニュアル
Antenna House Formatter V7 英語版マニュアル・XSL/CSS Extensions

DeepL翻訳結果・第一印象

日本語のHTMLをDeepLで英語に翻訳翻訳した結果はいちおうHTMLなのでブラウザで表示できます。最初に、翻訳元の日本語HTMLファイルと、DeepLで翻訳した英語HTMLファイルのブラウザ表示を比較してみます。

1)目次部分

翻訳元日本語目次(左)、翻訳結果の目次(右)

2)見出し、本文や表

見出し、本文(太字)、リンク、表

3)表と箇条書き

表と箇条書き

こうしてみますと、ブラウザで表示して比較できるレベルでタグが付いているようです。ただし、ブラウザはHTMLファイルのタグが正しくなくても表示できるように作られているので、ブラウザで表示できるからと言って、タグが完全に適切に付けられているとは言い切れません。

また、翻訳された内容を詳しく見ると、細かい点に問題が見つかります。

では、HTMLタグがどの程度まで適切に設定されているでしょうか? これを確認するにはHTMLファイルのタグを詳細にチェックする作業が必要になります。そこで、次回は、DeepLのHTML翻訳結果のタグ付けについて詳細に検討してみることにします。

[注1]
HTMLのタグの種類やタグ付けの規則については次の標準仕様で規定されています。
HTML Living Standard


骨抜き加速? 電子取引データ保存制度

令和5年11月17日 国税庁のWebサイトの制度のパンフレット等

新しいちらし「システム導入が難しくても大丈夫!!令和6年1月からの電子取引データの保存方法」(PDF)が掲載されました。

2024年1月から施行される電子取引データ保存制度への対応策が、国税庁のパンフレットにしては優しく表現されています。

制度が易しくなったのかな? と思いつつ読んでみると、このパンフレットに記載されている内容は、本ブログで紹介したことと同じです。但し、国税庁のちらしの方が分かりやすい印象はあります。

電子帳簿保存法の電子取引データ保存は、なにしろ、準拠する要件項目の組み合わせが多いので、条件の組み合わせを間違えないようにしつつ、説明を分かりやすくするのが難しい制度です。

これまでの説明はちょっと難しすぎたかな~? ちなみに、前回・前々回のブログへのリンクは次のようになります。

前回 2024年1月からの電子取引データ保存方策検討:検索要件対応で選択肢を細分すると・・・
前々回 電子取引データ保存要件の中で、複雑なパズル並みに理解し難いのが検索要件だ

関連記事


Wordでマニュアルを執筆してWebマニュアルを作る

お知らせ
2024年1月30日 事例紹介ウェビナーを開催いたします。
どうぞ、ご参加ください。
お申し込みは次からどうぞ。
ワードからすばやくウェブ オンワード

Microsoft Wordを製品やサービスのマニュアルを執筆するのに使用している人はかなり多いと思われます。

そうして作成した原稿はPDFとして配布されることが多いでしょう。なぜならば、Wordはもともとプリンタで紙に印刷して配布するための文書を執筆するツールだからです。

ところが、現在は、あらゆる情報をWebで閲覧・聴取する時代です。PDFは紙のページをそのまま電子化したもので、ディスプレイで閲覧するにはあまり便利ではありません。これは現実に多くの方が実感されていることでしょう。

そうすると、マニュアルをWordで制作した場合、どのようにしてWebページにするか、ということが大きな課題になるはずです。

この解決策はいろいろあります。一番、革命的解決策は、Wordでマニュアルの原稿を執筆するのをやめる、というものです。具体的には、マニュアルの内容をXMLとして用意するといったものです。

その対極としては、Wordで書いたマニュアルの原稿をWebページに変換する、という方法もあります。

ここにご紹介する『HTML on Word』は、後者の方法を実現するものです。今回、1年ぶりにV2にバージョンアップしました。今回のバージョンアップは、Wordで執筆してマニュアルからより実用的なWebページが作成できる様になりました。

主な機能強化点
1.HTMLを分割出力
 Word文書の章や節など、指定したアウトラインレベル単位で分割してHTMLを出力できるようになりました。

2.ページ移動リンクの出力
HTMLを分割して出力する場合は、オプションの指定で「前へ/次へ」といった、ページを順に移動するリンクを出力することができるようになりました。

3.目次の変換を強化
Wordの目次機能で作成した目次箇所を、HTMLの<nav>タグで出力するようにしました。また、目次箇所のタグやclassなどの要素を追加しました。

4.目次を別ファイルで出力
HTMLの分割時は目次箇所を別のファイル(html)として出力することができるようになりました。

30日間試用できるV2.0の評価版も提供しておりますので、上記新機能を実際にお試しいただけます。下記よりお申し込みの上、是非おご利用ください。

製品ページ
https://www.antenna.co.jp/xhw/

製品ページ・機能詳細
https://www.antenna.co.jp/xhw/function.html

評価版ダウンロード申込
https://www.antenna.co.jp/xhw/trial.html

英語版も
『HTML on Word』は英語版も用意しております。
英語版についての情報は次からご覧ください。

https://www.antennahouse.com/html-on-word-2.0


Pages: 1 2 3 4 5 6 7 8 9 10 ... 210 211 212 Next