作成者別アーカイブ: AHEntry

月曜日連載! Microsoft Wordスタイル探索 (32)Word文書からWebページ(HTML)変換の既存実現手段は?

現在のWebページの多くは、WordPress、はてなブログのようなブログ、Wikiペディアを代表とするWiki、最近では、noteやテッキーな人達にはGitHubが人気を集めています。こうしたWebページを見ると、一様に短文であり、またテキスト中心のシンプルな作りになっていて表現される内容の量や表現力という点で、PDFによるものと比べて、もの足りなく感じます。

PDFによる文書作成というと、まずMicrosoft Wordを思い浮かべるわけですが、Wordには、見出し作成、目次作成、段落への自動番号付け、文章の校閲機能、など強力な文章の編集機能があります。文章だけではなく、作図、表作成機能なども優れています。

Wordで図表などを盛り込んで作成した文書を、そのままWebページにできれば、Webページの表現内容がいまより豊かになるはずです。しかし、前回((31)WordのWebページ保存は使えない。その理由は?)も説明した通り、Wordで編集中の文書を、Word自身の「名前を付けて保存」「Webページとして保存」しても、そのままでは、Webページとして使えません。

Wordで作成した文書をWebページ(HTML)にしたいというニーズがあれば、それを満たすために、サービスやツールが提供されるのは必然です。次に、現在、どういうものがあるかを簡単にまとめてみます。

1.WordのWebページ保存で作成したHTMLをフィルターするツール
この代表例として、Webページ編集ソフトのDreamWeaverの「Word HTMLのクリーンアップ」機能があります。DreamWeaverは、デスクトップPC上で動作するアプリケーションです。「Word HTMLのクリーンアップ」ダイアログには次図のようなオプションがあります。

DreamWeaverの「Word HTMLのクリーンアップ」ダイアログ

DreamWeaverの「Word HTMLのクリーンアップ」ダイアログ


DreamWeaverの「Word HTMLのクリーンアップ」ダイアログ(続き)

DreamWeaverの「Word HTMLのクリーンアップ」ダイアログ(続き)


Wordを使ってWebページ保存したファイルで実際に試すと次の図のようなダイアログが表示されます。いろいろと不要なタグを削除したり、Word独自のスタイルを適用するための属性を削除しています。
DreamWeaverの「Word HTMLのクリーンアップ」結果報告ダイアログ

DreamWeaverの「Word HTMLのクリーンアップ」結果報告ダイアログ

2.Wordの不要なタグをフィルターするWebサービス
同じようなフィルタリング機能を提供するWebサービスもいろいろあります。

例えば、『Convert Word Documents to Clean HTML』サービスを見てみましょう。
https://word2cleanhtml.com/

Convert Word documents to Clean HTML のトップ画面

Convert Word documents to Clean HTML のトップ画面

簡単なサンプルで試してみます。次はWordで箇条書きを指定してみました。箇条書きの項目の一部にルビを指定しています。

Word文書で箇条書きを指定した部分

Word文書で箇条書きを指定した部分


この文書を『Convert Word Documents to Clean HTML』にペーストします。ペーストした段階では、箇条書き項目(上の図でアンダーラインの部分)は次のようになります。
『Convert Word Documents to Clean HTML』にペーストした状態

『Convert Word Documents to Clean HTML』にペーストした状態


このペーストしたファイルをコピーしてローカルにファイルとして保存、ブラウザ(Edge)で表示したところ次のようになります。
『Convert Word Documents to Clean HTML』にペーストした状態をブラウザで表示

『Convert Word Documents to Clean HTML』にペーストした状態をブラウザで表示

次に、これを「Convert to Clean HTML」(ボタン)でクリーンなHTMLにします。同じ箇所は次のようになっています。

『Convert Word Documents to Clean HTML』でクリーンなHTMLに変換した結果

『Convert Word Documents to Clean HTML』でクリーンなHTMLに変換した結果


一見して、Word文書をコピーしたときについていた沢山のタグが削除されて、シンプルなHTMLタグ付けになっています。ルビを付けた部分はきちんとルビタグで表現されています。

良さげです。しかし、この変換後のファイルをローカルに保存してブラウザ(Edge)で表示すると次のようになってしまいます。

『Convert Word Documents to Clean HTML』でクリーンなHTMLに変換した結果をブラウザで表示

『Convert Word Documents to Clean HTML』でクリーンなHTMLに変換した結果をブラウザで表示

箇条書きの項目先頭の記号が文字化けしてしまっています。

この変換例では、前回((31)WordのWebページ保存は使えない。その理由は?)で整理した問題の中で、次の二つが該当します。

(2) 箇条書きを通常の段落タグにしているなどタグの表現が貧困
(3) 文字化け

『Convert Word Documents to Clean HTML』サービスはかなり良さそうですが、結構、大きな問題が残っています。

要するに、Wordで作成した文書からHTMLを作って、単にフィルタリングするだけでは不十分であり、もう少し賢い解決策が必要、と言えるでしょう。

——-
◆前回:月曜日連載! Microsoft Wordスタイル探索 (31)WordのWebページ保存は使えない。その理由は?
◆次回:月曜日連載! Microsoft Wordスタイル探索 (33)Word文書からWebページ(HTML)変換について考える
シリーズ総目次
〇関連ページ
Microsoft Wordを使って報告書などの長文を作成する人向けの新知識満載です。 Microsoft Wordのアウトラインと見出しスタイルを活用する方法(概要)

Antenna House Office Serversとは

Antenna House Office Serversとは




アウトライナー
PDFを解析して しおり・目次を自動生成


瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識

【動画公開】「DITAで本を書いてAH XSL Formatterで自動組版する」、FormatterClub2021ウェビナーのお知らせ

2021年8月10日に開催しました、ちょっと一息アンテナハウスウェビナー「DITAで本を書いてAH XSL Formatterで自動組版する」の録画を編集した動画が公開されています。

動画は1本10分程度の4本立てとなりました。

ご好評いただけましたようで、当日は予定時間をはみ出すくらいにご質問をいただきました。
「タグを気にせず書きたい」といった意見もございました。個人的には「タグを気にしながら書きたい」派でしたのでそういった方のための資料はあまり用意できていなかったのですが、そういった方面のアプローチも存在しますので、機会があればあらためてまとめたいと思います。

さて、この動画自体は少し前に公開されたのですが、何故今ブログ記事にしているかというと、次のイベントに関連するためです。

FormatterClub2021ウェビナー開催

日時
2021年9月17日(金)17:00~18:10
概要
今回のFormatterClubでは、キヤノンの吉田一様にFormatterでのマニュアル作成と自動組版の取り組みの発表の他、XSL拡張仕様のご説明、AH Formatterの今後をご紹介を致します。
内容紹介・お申込みページ
ウェビナー登録ページ【終了しました】

Formatter Club は、アンテナハウスの XML 自動組版ソフト『AH Formatter』を導入されているユーザーや関心を持っていただいている皆様と開発者とを繋ぎ、会員同士の交流、情報交換により『AH Formatter』の利用技術を向上させ、より皆様のお役に立てる製品としていくために役立てることを目的として発足いたしました。
『AH Formatter』とその関連技術(XSL、CSS、XML 多言語組版など)に関心のある方でしたらどなたも参加できます。参加費は無料です。
Formatter Club の活動には会員メーリングリストを情報交換のために利用し、会員専用の Web ページも提供いたします。また定例会を開催し、会員相互の親睦をはかります。定例会は、『AH Formatter』開発者から最新バージョンの紹介・デモ、活用事例紹介、組版技術の向上のための勉強会などを行います。

Formatter Club について | アンテナハウス株式会社

ということで、「XSL拡張仕様のご説明」として『使いこなしガイド』の紹介をさせていただく予定です。
今回のウェビナーはFormatter Club会員様以外でも参加が可能ですのでお気軽にご登録、ご視聴ください。

関連記事





瞬簡PDF 作成 2024
ドラッグ&ドロップでPDF作成


瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品!

待ったなしR4年1月からの電子取引の要件確保の現実「解」

突然の国税庁の制度改正で、今まで認められていた「PDF等の電子請求書等」の「紙に出力しての保存」が令和4年1月1日から保存義務違反になります。
皆様は、ご存じですよね!
そして、対策は検討していますか?

<制度改正の裏付>

電子取引_一問一答_問42より

電子取引の取引情報に係る電磁的記録について保存要件を満たして保存できないため、全て書面等に出力して保存していますが、これでは保存義務を果たしていることにはならないため青色申告の承認が取り消されてしまうのでしょうか。また、その電磁的記録や書面等は税務調査においてどのように取り扱われるのでしょうか。

【回答】
令和4年1月1日以後に行う電子取引の取引情報に係る電磁的記録については、その電磁的記録を出力した書面等による保存をもって、当該電磁的記録の保存に代えることはできま せん。 したがって、災害等による事情がなく、その電磁的記録が保存要件に従って保存されていない場合は、青色申告の承認の取消対象となり得ます。 なお、青色申告の承認の取消しについては、違反の程度等を総合勘案の上、真に青色申告 書を提出するにふさわしくないと認められるかどうか等を検討した上、その適用を判断しています。また、その電磁的記録を要件に従って保存していない場合やその電磁的記録を出力した書 面等を保存している場合については、その電磁的記録や書面等は、国税関係書類以外の書類とみなされません。 ただし、その申告内容の適正性については、税務調査において、納税者からの追加的な説明や資料提出、取引先の情報等を総合勘案して確認することとなります。

<個人事業主・小規模中小企業が一番にやるべき対策>電子取引_一問一答_問12より

以下のような方法で保存すれば要件を満たしていることとなります。

1 請求書データ(PDF)のファイル名に、規則性をもって内容を表示する。 例) 2022年(令和4年)10月31日に株式会社国税商事から受領した110,000円の請求書 ⇒「20221031_㈱国税商事_110,000」
2 「取引の相手先」や「各月」など任意のフォルダに格納して保存する。
3 【問24】に記載の規程を作成し備え付ける。
※ 税務調査の際に、税務職員からダウンロードの求めがあった場合には、上記のデータについて提出してください。
※ 判定期間に係る基準期間(通常は2年前です。)の売上高が 1,000万円以下であり、上記のダウンロードの求めに応じることができるようにしている場合には、上記1の設定は 不要です。

【問24】に記載の規程とは:下記からダウンロードください。
参考資料(各種規程等のサンプル)|国税庁 (nta.go.jp)

不明点やアドバイスが欲しい方は、ご連絡ください。

【お薦め無料ウェビナーのご案内】

【先進事例セミナー】DXで加速する改正電帳法ソリューション!最新法令情報と複合機等を利用した先進事例紹介

日時:
2021年9月14日(火)13:30~14:40
概要:
  • 国税関係書類の電帳法「スキャナ保存」を導入する上で、キーソリューションとなるのが複合機や専用スキャナです。
  • 本ウェビナーでは、電帳法の最新情報と、証憑書類の仕分け作業や紙の原本廃棄の事例を、富士フイルムビジネスイノベーションジャパン株式会社と共同で紹介します。
★内容紹介・お申込みページ:
https://www.kokuchpro.com/event/ah_210914/【終了しました】



瞬簡PDF 変換 2024
PDFをOffice文書へ高精度変換


アウトライナー
PDFを解析して しおり・目次を自動生成

月曜日連載! Microsoft Wordスタイル探索 (31)WordのWebページ保存は使えない。その理由は?

先週は(30)WordのWebページ保存は使えるか?というタイトルでWebページ保存があることを紹介しました。しかし、肝心の質問に答えるまでには至りませんでした(申し訳ありません)。今日は、いよいよ質問に答えてみたいと思います。

日ごろから使い慣れたMicrosoft Wordで書いた原稿を、そのままWebページにできたら、Webページ作成がより身近になることでしょう。さらにWordには、見出し作成、目次作成、段落への自動番号付け、文章の校閲機能、など強力な文章の編集機能があります。文章だけではなく、作図、表作成機能なども優れているので、Wordで図表などを盛り込んで作成した文書を、そのままWebページにできれば、Webページの表現内容もいまより豊かになるはずです。

こうしたメリットが期待できるにも関わらず、アマチュアならともかく、プロの制作者で実際にWordの原稿をそのままWebページにしている人はあまりいないはずです。なぜか? その理由は単純にWordのWebページ保存は使いものにならないからです。

何が問題なのでしょうか? 以下は、やや技術的になりますが、実際の文書で調べた結果です。調査はWord 2019のWebページ保存(フィルター後)で行いました。

先週は、WordのWebページ保存には、①Webページ保存と、②Webページ保存(フィルター後)の2種類があること、Webページ保存では、ブラウザの表示には使わない、いろいろなファイルが保存されていることを示しました。ですので、WordでWebページを作るなら、Webページ保存(フィルター後)の方が適切なはずです。

Webページは、HTML(Hyper Text Markup Language)で書きます。Webページ保存(フィルター後)のHTMLファイルを、oXygen XML Editorで開いて内容を見てみます。先週、使ったファイルの本体(bodyタグ)先頭部分は次のようになっています。

WordでWebページ保存(フィルター後)の内容

WordでWebページ保存(フィルター後)の内容

気が付いた点を次に大雑把に整理してみます。

(1) 和欧混植の言語指定方法が不適切
和欧混植の文を、bodyにlang=JAを指定したうえで、段落のラテン文字に<span lang=EN-US>という属性をつけています。この結果、段落の文はすべて次のようにマークアップされています。

<span lang=EN-US>Word</span>の情報タイトルが<span lang=EN-US>HTMLの<span
lang=EN-US>title</span>に出力

しかし、日本語の文にはラテン文字を混在できるので、このような指定は不要です。こうした出力ではHTMLになった文章を編集するのが厄介になってしまいます。

(2) 箇条書きを通常の段落タグにしているなどタグの表現が貧困
Wordで箇条書きを指定した段落、番号付き段落などは、行頭に記号や数字のついた通常段落として表現されています。段落タグ以外で使われているのは、見出しランクタグ<h?>、表(<table>など)、イメージ(<img>)、文字飾り(<b>、<u>など)僅かで、タグの種類としては、このブログ(WordPress)よりも少なそうです。

(3) 文字化け
次の例は、別の箇条書きの部分ですが、フォントが段落の一部に直接指定されています。箇条書き記号にWingdingsというWordで昔から使われている特殊なフォントが指定されています。箇条書き記号はUnicodeでU+00B2(SUPERSCRIPT TWO: 上付きの2。これはおそらくWingdingsの内部番号をそのまま出している)となっていて、文字化けしています。Unicode標準にマップするなら、U+2727(WHITE FOUR POINTED STAR)とすべきではないかと思います。

<p class=a1><span style='font-family:Wingdings'>²<span style='font:7.0pt "Times New Roman"'> 
</span></span><span lang=JA style='font-family:HGP正楷書体'>新しい箇条書きスタイル</span></p>

(4) レイアウト指定が固定的になっており、後でCSSで変更できない
・通常の段落は<p class=MsoNormal>が指定されており、MsoNormalというクラス属性には、Wordで指定した段落スタイルをCSSにしたものが指定されているため、Webページに別のCSSをリンクしてレイアウトを変更しにくい。
・bodyにはstyle=’word-wrap:break-word;text-justify-trim:punctuation’のようにスタイルを直接指定しています。

これでは、原稿の作者が指定したレイアウトがWebページに影響を及ぼしてしまいます。現在のWebページは、文章などのコンテンツに対して、CSSでレイアウトを自由に指定・変更することが多いのですが、WordのWebページ保存は、コンテンツにレイアウトが密接に紐づいてしまっています。特にWordのレイアウトは紙にプリントすることを暗黙に想定されているのでWebページにそのまま使うのは不向きです。

(5) HTML文法上の問題
pタグにalign属性を付けるなど、既に廃止されたタグを使っているため、今回の文書では、oXygen XML EditorからHTML検証エラーが140個出されています。

以上は、一例に過ぎませんが、WordのWebページ保存(フィルター後)には、技術的にかなり問題があると言えます。なお、WordのWebページ保存はラウンドトリップ(HTML保存した結果を読むと元のWordのdocx版に戻ること)を想定しているためか、WordのWebページ保存(フィルター後)と比べて、さらに不要な情報が出力されています。

—-
宣伝です。来る10月12日(火)16時から、「ちょっと一息・アンテナハウスウェビナー」で、

WordでHTMLを書けたらスゴイ!

という題で、Microsoft Wordで書いた文書からWebページ(HTML)を作るというトピックについてお話しする予定です。関心をお持ちの方は、ぜひ、ご参加ください。

——-
◆前回:月曜日連載! Microsoft Wordスタイル探索 (30)WordのWebページ保存は使えるか?
◆次回:月曜日連載! Microsoft Wordスタイル探索 (32)Word文書からWebページ(HTML)変換の既存実現手段は?
シリーズ総目次
〇関連ページ
Microsoft Wordを使って報告書などの長文を作成する人向けの新知識満載です。 Microsoft Wordのアウトラインと見出しスタイルを活用する方法(概要)

Antenna House Office Serversとは

Antenna House Office Serversとは




アウトライナー
PDFを解析して しおり・目次を自動生成


瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識

e-na伊那谷 旅便り 第74回 権現桜

伊那谷の箕輪町中曽根集落の中心にある桜の名木「権現桜」。

8月の権現桜

樹齢は1000年を超えるといわれるエドヒガンザクラ。樹高は約15 m、周囲6.7 mの大樹で長野県の天然記念物にも指定されています。

樹勢が良く整っていて年間を通し見応えのある大樹ですが、やはり桜が開花しているときの眺めは格別です。

開花時期(4月)の権現桜

桜の満開時期は毎年4月中旬から下旬。また、開花時期の夜にはライトアップもされ美しい眺めを更に際だたせてくれます(残念ながら手元にライトアップ時の写真はありませんでした…)。

権現桜という名称の由来は、樹下の祝殿に権現様が祀られているからとのことです。

8月の祝殿

枝が大きく東西に分かれ、分かれた枝で花の色味が異なっているその姿から地元では夫婦桜とも呼ばれ親しまれています。


アンテナハウスブログ「I love Softwera2!」で連載の「e-na 伊那谷 旅便り」を再構成してWeb「e-na 伊那谷 旅便り」にまとめました。




瞬簡PDF 変換 2024
PDFをOffice文書へ高精度変換


瞬簡PDF 作成 2024
ドラッグ&ドロップでPDF作成

電帳法YouTube視聴ベスト3から見えた各企業の気になるポイントとは!

に公開開始しましたチャネル
https://www.youtube.com/channel/UCsfsd6GsnEIIiqGsfbLfkzw
もお陰様で、9881回のご視聴を頂きました!

その中でベスト3が下記のもので、合計3653回(約37%)視聴されています。

    • この3つが、各企業が気にしているテーマになる訳です。
    • タイムスタンプを知り、国税庁の電帳法のページの見方を把握して、「電帳法」を優しく解説を視聴する!

皆様も是非とも、ご視聴ください。

順位 タイトル 回数 URL
1 【有料級】セミナー第4回 タイムスタンプって_なに? 1611回 https://youtu.be/RqRbwlHvAfo
2 【有料級】セミナー第5回_国税庁の「電子帳簿保存法」のページの見方 1054回 https://youtu.be/pCUfL17KgEY
3 【有料級】セミナー第2回「電帳法」を優しく解説 988回 https://youtu.be/RbEZe00m0TA

★そして、最新情報はこちら★

  • 改正電帳法 国税庁ページの見方 【21年】7月21日時点

  • 見えてきた”改正”電帳法規則(通達・QA等)【21年】の7月21日時点_最新情報


【その他ご案内】

  1. 国税庁お墨付きのe-Successカタログは、
    https://www.antenna.co.jp/e-success/catalog.html
  2. e-Successの1カ月無料体験版は、
    https://www.antenna.co.jp/e-success/trial.html
  3. e-Success販売キャンペーン
    https://www.antenna.co.jp/e-success/campaign-2021.html

令和3年度税制改正に基づいて、令和4年1月より国税庁によって電子帳簿保存法が抜本的に緩和されることになりました。
この緩和により制度導入へのハードルが大きく下がり、より多くの企業様が電子帳簿保存法「スキャナ保存」「電子取引」制度を導入しやすい環境になります。
アンテナハウス株式会社ではこの大幅緩和を記念して、弊社の「スキャナ保存」「電子取引」対応用システム『e-Success』(イー・サクセス)をより導入しやすい特別価格でのキャンペーンを実施しています。
この機会にぜひご検討ください。

【先進事例セミナー】DXで加速する改正電帳法ソリューション!最新法令情報と複合機等を利用した先進事例紹介

日時:
2021年9月14日(火)13:30~14:40
概要:
  • 国税関係書類の電帳法「スキャナ保存」を導入する上で、キーソリューションとなるのが複合機や専用スキャナです。
  • 本ウェビナーでは、電帳法の最新情報と、証憑書類の仕分け作業や紙の原本廃棄の事例を、富士フイルムビジネスイノベーションジャパン株式会社と共同で紹介します。
★内容紹介・お申込みページ:
https://www.kokuchpro.com/event/ah_210914/【終了しました】



瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識


瞬簡PDF 作成 2024
ドラッグ&ドロップでPDF作成

月曜日連載! Microsoft Wordスタイル探索 (30)WordのWebページ保存は使えるか?

来る10月12日(火)16時から、「ちょっと一息・アンテナハウスウェビナー」で、

WordでHTMLを書けたらスゴイ!

という題で、Microsoft Wordで書いた文書からWebページ(HTML)を作るというトピックについてお話しする予定です。そこで、その準備も含めて、月曜日連載! Microsoft Wordスタイル探索では、10月12日までの間、WordでHTMLを作ることをテーマに探索してみたいと思います。

WordでWebページを作ると言えば、Wordをいつも使っている人なら、WordのWebページ保存を使うことを思い浮かべるでしょう。そこで、まず、WordのWebページ保存を探索してみます。(以下は、Microsoft Word 2019 (バージョン2107、ビルド14228.20250)、をWindows 10 Proで使用して調査しました。)

Wordで編集中の文書を「名前を付けて保存」を実行すると保存ダイアログが開きます。そのファイルの種類から次の図のように様々なファイル形式を選択して保存できます。

Wordの名前を付けて保存で選択できるファイル形式

この中でWebページに関係ありそうなファイル形式は次の三つです。

・単一ファイルWebページ
・Webページ
・Webページ(フィルター後)

それぞれの形式で保存して調べてみます。最初は、単一ファイルWebページです。

単一ファイルWebページは画像まで含めて一つのファイルとして保存されます。ファイルの拡張子は既定値では.mhtです。この保存したファイルをダブルクリックすると、インターネット・エクスプローラが立ち上がってファイルの内容を表示できます。しかし、このファイルは、マイクロソフトの最新ブラウザであるエッジやFireFoxなどでは内容を正しく表示できません。

念のため、.mhtファイルをテキストエディタで開いてみますと、先頭に次のような文章があります。

MIME-Version: 1.0
Content-Type: multipart/related; boundary="----=_NextPart_01D797DF.52FF6750"

このドキュメントは単一ファイル Web ページ (Web アーカイブ ファイル) です。お使いのブラウザーまたはエディターは Web アーカイブ ファイルをサポートしていません。Web アーカイブをサポートするブラウザーをダウンロードしてください。

------=_NextPart_01D797DF.52FF6750
Content-Location: file:///C:/754AB838/file1096.htm
Content-Transfer-Encoding: quoted-printable
Content-Type: text/html; charset="utf-8"

単一ページWeb形式はHTMLファイルではなく、インターネット・エクスプローラ専用のファイル形式のようです。もちろん、Wordで保存した.mhtファイルを元のWordで開くことはできます。なんにしてもこれはWeb形式という名前がついているだけであって、一般のブラウザで表示できるWebページではないと言ってよいでしょう。

次に、WebページとWebページ(フィルター後)を見てみます。

編集中のWord文書をこの二つの形式で保存すると、次の図のように.htmという拡張子のファイルと、ファイル名の最後に.filesという名前の付いたフォルダーができます。

Wordの文書をWebページとして保存したときできるファイルとフォルダー

htmの内容を調査するのは後回しにして、.filesフォルダーの内容を見てみます。

次は、Webページで保存したときにできる.filesフォルダーの内容です。.pngという拡張子のファイルはイメージ画像ですが、それ以外にいろいろな種類のファイルができています。

Webページとして保存したときの.filesの内容

Webページ(フィルター後)で保存したときにできる.filesフォルダーの内容は次の図のようになります。こちらは、.pngという拡張子のファイルのみです。

Webページ(フィルター後)で保存したときの.filesの内容

.filesフォルダーの中をみただけで想像できることはWebページ(フィルター後)の方は、Webで必要な最小限の情報だけに絞っているようだ、ということです。

この両者のhtmファイルをブラウザで表示して、Webページとしての評価をする前に、Wordで読み込んでどうなるかを見てみます。

元のWord文書とhtmファイルをWordで読み込んだ結果のページを比較してみます。

htmファイルをWordで読み込んで元のWord文書と比較

htmファイルをWordで読み込んで元のWord文書と比較

Webページとして保存したhtmをWordで読み込むとほぼ元のWord文書に戻ります。しかし、Webページ(フィルター後)として保存したhtmをWordで読み込むと元のWord文書に近くはなりますが、レイアウトが崩れたり表示されない画像があったりします。

次は、元のWord文書とWebページ(フィルター後)として保存したhtmを読み込んでページを比較した例です。

Webページ(フィルター後)として保存したhtmを読み込んだ結果と比較

Webページ(フィルター後)として保存したhtmを読み込んだ結果と比較


この例では番号付き段落の文字のならびの間に画像が入ってしまう、などの文字のならびの崩れが確認できます。

まとめると、Webページとして保存するとWebでは使わない様々なファイルが同時に保存されるが再びWordに読み込んだ時にもとに戻る。しかし、Webページ(フィルター後)として保存すると、Webページでは使わないファイルは削除されてしまい、再びWordに読み込んだ時に元に戻らない箇所がある、と言えます。

——-
◆前回:月曜日連載! Microsoft Wordスタイル探索 (29)WordでHTMLを書けたらスゴイ!
◆次回:月曜日連載! Microsoft Wordスタイル探索 (31)WordのWebページ保存は使えない。その理由は?
シリーズ総目次
〇関連ページ
Microsoft Wordを使って報告書などの長文を作成する人向けの新知識満載です。 Microsoft Wordのアウトラインと見出しスタイルを活用する方法(概要)

Antenna House Office Serversとは

Antenna House Office Serversとは




瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品!


アウトライナー
PDFを解析して しおり・目次を自動生成

XSL-FO試行錯誤 索引の索引関連FO以外の箇所

個人的な話として、索引周りは既にあるなら自前で実装したくはない箇所です。

索引に関連した仕様はXSL-FO 1.1で追加されました*1。1.1は2007年には登場しており、私が学び始めた時点で既に存在します。

先日それ以前に書かれたコードに触れる機会があり、<fo:basic-link>とXSLT 1.0で書かれた処理を見て苦労を偲びました。

索引関連のFOはアンカーと、アンカーの参照、その参照をまとめて書式などを調整するものがあります。

組版するまで未決定なページ番号関連の挙動を制御してくれる索引のFOですが、逆に、索引対象語のソートなどはXSLTなどで、索引の表示レイアウトは通常のブロックやリーダなどで行うことになります。

テキストの揃えやリーダ関係ではAH Formatterのマニュアルにあるように*2指定すれば、よく目にする「テキストはstartの端、ページ参照はendの端」という見た目の索引とできるでしょう。目次もこのようなレイアウトを取ることがあります。

索引の索引語ごとのブロックとしては@text-align@text-align-last、(axf:text-align-first)で揃えを制御し、@keep-together.within-pageでページ参照部分だけ次ページに分割されてしまうことがないように、という指定を行うことになるでしょうか。このときインラインの構造としては「索引語」「リーダ」「索引参照のFO」という並びになります。

さらに大きい構造として、「索引の見出し文字」と「索引語ごとのブロックの連続」となります。このとき見出し文字のブロックに@keep-next.within-pageでこの箇所での分割を避けておく必要がありますね。

参考資料





瞬簡PDF 編集 2024
かんたん操作でPDFを自由自在に編集


瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識

「電帳法」ウェビナーからQ & A 4篇をご案内します

改正された「電帳法」のウェビナーの中から、視聴者とのリアルなQ&A部分を切り出した4篇を纏めてご案内します。
これを見れば、検討企業の疑問や悩みが見えてきます。

例えば)

  • アマゾンで購入した際の電子領収書の保存の扱いは?
  • タイムスタンプは本当に不要になるのか?
  • 帳簿と書類の違いは?
  • 紙の契約と電子契約の信頼性の違いは?

提案側の皆様も、検討中の企業の方々も、落ち着いてご確認いただければ、参考になると思います。

21年7月21日ウェビナー視聴者様との質疑応答編

20210622 改正電帳法 最新(6月22日時点)Q&A編

改正電帳法 ズバリ解説  ④ 質疑応答編(2021年5月25日に開催)

5)_電子帳簿保存法_改正_施行規則_抜本緩和内容とウェビナー視聴者様とのQ&Aなど(2021年5月12日に開催)

【その他ご案内】

  1. 国税庁お墨付きのe-Successカタログは、https://www.antenna.co.jp/e-success/catalog.html
  2. e-Successの1カ月無料体験版は、https://www.antenna.co.jp/e-success/trial.html
  3. e-Success販売キャンペーンhttps://www.antenna.co.jp/e-success/campaign-2021.html

令和3年度税制改正に基づいて、令和4年1月より国税庁によって電子帳簿保存法が抜本的に緩和されることになりました。
この緩和により制度導入へのハードルが大きく下がり、より多くの企業様が電子帳簿保存法「スキャナ保存」「電子取引」制度を導入しやすい環境になります。アンテナハウス株式会社ではこの大幅緩和を記念して、弊社の「スキャナ保存」「電子取引」対応用システム『e-Success』(イー・サクセス)をより導入しやすい特別価格でのキャンペーンを実施しています。
この機会にぜひご検討ください。

【先進事例セミナー】DXで加速する改正電帳法ソリューション!最新法令情報と複合機等を利用した先進事例紹介

日時:
2021年9月14日(火)13:30~14:40
概要:
  • 国税関係書類の電帳法「スキャナ保存」を導入する上で、キーソリューションとなるのが複合機や専用スキャナです。
  • 本ウェビナーでは、電帳法の最新情報と、証憑書類の仕分け作業や紙の原本廃棄の事例を、富士フイルムビジネスイノベーションジャパン株式会社と共同で紹介します。
★内容紹介・お申込みページ:
https://www.kokuchpro.com/event/ah_210914/



瞬簡PDF 作成 2024
ドラッグ&ドロップでPDF作成


アウトライナー
PDFを解析して しおり・目次を自動生成

月曜日連載! Microsoft Wordスタイル探索 (29)WordでHTMLを書けたらスゴイ!

おはようございます。

2か月近く先になりますが、10月12日(火)16時から、いつもの、「ちょっと一息・アンテナハウスウェビナー」は、

WordでHTMLを書けたらスゴイ!

という題で、Microsoft Wordで書いた文書からWebページ(HTML)を作るというトピックについてお話しする予定です。そこで、その準備も含めて、月曜日連載! Microsoft Wordスタイル探索では、これから10月12日までの間、WordでHTMLを作ることをテーマにいろいろと探索してみたいと思います。

振り返ってみると、

1980年代半ばにパソコン(Personal Computer: PC)が誕生しました。PCの用途の一つにOfficeでの文書作成があります。PCが普及する前、私が社会人になった約45年前は日本のオフィスでの文書作成と配布は、もっぱら手書きとコピー、そして公式文書は簡易印刷でした。その後、ワープロ専用機が登場して、手書きによる文書作成がなくなりました。

現在は、デスクでの文書作成作業には、ほとんどPCのワープロを使うようになっています。

1980年代後半に、いろいろな日本語ワープロソフトが登場してしのぎを削っていましたが、現在は、Microsoft Wordが圧倒的なシェアをもっています。Word以外には、Google DocsとかLibre Officeを使う人もいるかもしれませんが、少数派と言ってよいでしょう。

Wordで作成した文書は、当初は、プリンタで紙に印刷して配布されました。現在では、PDFの形式で配布されるのが当たり前となっています。

PDFは、紙に印刷されるレイアウトをそのまま電子ファイルにした形式です。つまり紙を使った情報の配信をそのままデジタル化したのがPDFによる情報配信と言えます。
参考) PDFとは? そのメリット、活用法など

今後は、
現在、公開される情報配信はWebページが圧倒的に主流になっています。非公開・社内向けの情報配信でさえもイントラネット上のWebページとして配信されているものが多いと思います。

Webページで配信する情報を表現するとき、基本はHTML形式を使います。HTML形式の最新であるHTML5は、現在WHATWGという団体が策定しているものです。
HTML標準仕様の策定についてW3CとWHATWGが合意 今後はWHATWGのリビングスタンダードが唯一のHTML標準仕様に

HTMLを表示するにはブラウザを使いますが、最新の主要ブラウザはHTMLだけでなくPDFを表示する機能を内蔵していますので、HTMLとPDFはほとんどシームレスにいったりきたりできます。

但し、これは設定によります。PDFをダウンロードする設定になっているとシームレスな移動はできません。詳しくは次をご参照ください。
参考)ブラウザでPDFファイルをWebページからシームレスに表示するか、ダウンロードするかの設定

こうしてPDFで作成した文書をそのままWebページで配信しても、大きな問題はなくなってきたとも言えます。

ところが不都合なことが一つあります。それは、現在、Webページを閲覧するのはPCではなくスマホが主流になってきていることです。スマホでもPDFを表示はできますが、画面が小さいので見ずらいと感じている人は多いでしょう。

普通に考えるとWordで作成した文書をWebページで配信するなら、PDF(のみ)ではなくてHTML形式にしてほしいという要求が高まっての不思議ではありません。

しかし、これは実は結構難しい問題なのです。それが、WordでHTMLを書けたらスゴイ!ということの意味になります。では実際に何がスゴイって? それについてはこれから順次お話していきたいと思います。

——-
◆前回:月曜日連載! Microsoft Wordスタイル探索 (28)これまでの27回の人気記事は?
◆次回:月曜日連載! Microsoft Wordスタイル探索 (30)WordのWebページ保存は使えるか?
シリーズ総目次
〇関連ページ
Microsoft Wordを使って報告書などの長文を作成する人向けの新知識満載です。 Microsoft Wordのアウトラインと見出しスタイルを活用する方法(概要)

Antenna House Office Serversとは

Antenna House Office Serversとは




瞬簡PDF 変換 2024
PDFをOffice文書へ高精度変換


瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品!
Pages: Prev 1 2 3 ... 11 12 13 14 15 16 17 ... 215 216 217 Next