日別アーカイブ: 2019年5月16日

PDF2.0のタグ事情

PDF2.0の仕様が策定されてから暫く経ちましたが、PDF1.x系 とタグ関連の違いについて述べたいと思います。以下の要素の変更がありました。

廃止された要素

  • Sect
  • Art
  • BlockQuote
  • TOC
  • TOCI
  • Index
  • NonStruct
  • Private
  • Quote
  • Note
  • Reference
  • BibEntry
  • Code

追加された要素

  • DocumentFragment
  • Aside
  • Hn (where n > 6)
  • Title
  • FENote
  • Sub
  • Em
  • Strong
  • Artifact

廃止になった要素をどの様に代替するのかを考えると、Sect は Part で置換、Art は Aside で置換、Note は、FENote で置換できそうです。
Reference に関しては、要素の辞書に Refが追加されたので、それを使えば良いと思われます(読み上げ機能を考えると単純に置き換えて上手く行くかは疑問に残りますが…)。

他の要素に関しては、HTML にある要素は、Namespace を設定すれば、今まで通り使える可能性も有りますが、基本的に置換が難しいです。
PDF2.0 のタグを使わず、当面は Namespace を設定して PDF1.x系 の仕様のままタグ付けるのが、無難な気がしてきました。




アウトライナー
PDFを解析して しおり・目次を自動生成


HTML on Word
WebページをWordで作る!