カテゴリー別アーカイブ: コラム

YouTube動画作成体験1

ということで、昨年(2020年)から始まった「ちょっと一息、アンテナハウスウェビナー」*1動画の作成体験をつらつら語っていくことにします。

動画編集の経緯

さていきなりですが、筆者が所属するグループは一応「営業」になります。それがなんで動画作成するようになったかというのは、単に会社で使っている主要ソフトウェアライセンスが、Adobe Creative Cloudだったからです。ここには、動画編集といえばこれ!ともいうべき「Adobe Premiere Pro」をはじめ、「Adobe Audition」や「After Effects」が同梱されています。…全然使いこなせていませんが。

会社的理由としては、やはりコロナ禍の影響です。
これまでアンテナハウスも、ソフトウェアハウスらしくIT系のイベントにはちょいちょい参加してきましたが、リアルイベントが大小問わず軒並み中止に追い込まれました。これにより製品の販促手段の半分近くを失ったため、代替手段として、Webページの強化やウェビナーの開催、動画の作成という方針を取りました。

いざ、動画さくせい!

出来ませんでした…。
事務用のPCではスペックが動画編集にまるで足りず、高性能のグラフィックボード(通称:グラボ)と、高性能のCPUとかが必要で、結局会社で使用していたビルドマシンにPremiere Proの要求を満たすスペックのグラボを導入して使うことになりました。導入までの間は、Shotcut*2というフリーツールを使って作業していました。

これで初めて作った動画が、こちらになります。

ここまでの動画編集・作成作業でわかったこと

必要なもの、あったほうがよりよいもの
元となる動画(ないと作れない)
BGM(ないなりにできるけど、あったほうが閲覧者を掴みやすい)
音声ツール(なくてもいいけど、ウェビナーとか、もともと録画用に作ろうとしていない動画には、アナウンスとか要所要所にあったほうがいい)
画像等素材(なくてもいいけど、後でzoomのウェビナー動画を見てみると、わかりづらいことが多い。それを補足するための素材があると、より分かりやすい動画ができます)

動画の作成は、Webページを作るより大変でした…。
今回はこの辺で。

筆者の動画編集の結果を見たい方はぜひ「アンテナハウスPDFチャンネル」の「アンテナハウスウェビナー」を確認してみてください。





アウトライナー
PDFを解析して しおり・目次を自動生成


瞬簡PDF 作成 2024
ドラッグ&ドロップでPDF作成

【動画公開】「ダスキン伝票」や「領収書」等ペーパーレス経理を(株)武蔵野がどう実現したか!?

2021年1月22日のウェビナーの収録動画を見やすく加工しました。
気になるところから是非ご視聴ください。
皆様の参考になれば幸いです。

【概要・内容】

株式会社武蔵野様は、お客様第一主義・環境整備・経営計画書の3本の柱を磨きつづけておられ、
2000年度の日本経営品質賞の受賞をきっかけに、あらたなビジネスモデルとしての「経営サポート事業」を発足させ、全国の中小企業の皆様の業績向上・お客様満足度向上に貢献する活動を行っておられ、そして、2010年、再度日本経営品質賞を受賞するされている優良企業様です。

この度武蔵野様は 「第12回JIIMAベストプラクティス賞」を受賞した茨城県大同青果株式会社(武蔵野様の経営サポート会員企業)の「ScanSave」※事例を横展開し、長年紙での原本保存をしていた「ダスキン伝票」及び経費精算「領収書」等の電子化に成功されました。本成功事例をキーマンの方に直接詳しく語って頂く、貴重なセミナーです。

【収録4篇】

ウェビナー ご挨拶とタイムスケジュール

武蔵野様 岡本経理部長様 ご講演

武蔵野様 滝澤営業サポート事業部長様 ご講演

https://youtu.be/t8T4Fo3S_C0

茨城県大同青果 鈴木常務様 ご講演



新春ウェビナーのご案内

■「手書き受注伝票」「ダスキン伝票」「納品書」等のOCRとスキャナ保存の先進事例 ウェビナー【終了しました】

「手書き受注伝票」「ダスキン伝票」「納品書」等のOCRとスキャナ保存の先進事例 ウェビナー
日時 2021年2月16日(火)13:30~14:30
概要 国税関係書類の電帳法「スキャナ保存」を導入する上で、キーソリューションとなるのがOCRです。
今回のウェビナーでは、JIIMA2020年ベストプラクティス賞を受賞した茨城県大同青果株式会社様、株式会社武蔵野様、神奈川県の中堅製造業様の事例に基づいた「OCR」と「スキャナ保存」について、デモを交えて解説をします。
内容紹介・お申込みページ こくちーずからお申し込み:
https://www.kokuchpro.com/event/20210216/【終了しました】




瞬簡PDF 編集 2024
かんたん操作でPDFを自由自在に編集


瞬簡PDF 作成 2024
ドラッグ&ドロップでPDF作成

ファイルを添付したPDF

「PDFに添付ファイルを含むことができる」ということは「PDFに入力可能なフォームを設定できる」ことなどに並び、あまり浸透していないのでは?と思い、改めて触れてみることにしました。

「PDF中の表などの数値を抽出したい」など、いわゆるテキスト抽出の要望と解決法についての議論などは度々目にします。アンテナハウスPDF資料室*1では、主に「PDFの再利用」の項で扱っている内容になります。すでにPDFになってしまっているデータについては、OCRやテキスト抽出などの領分です。これはすでに配布されているPDFに対する読者側のアクションです。

一方作成側は「再利用しやすいPDF」を提供することができます。テキスト情報の埋め込みなどもその範疇ですが、そもそも表をPDFにするのであれば、元の表データを一緒にしておけば利用者側が抽出する手間が省けます。ならば最初から表を、CSVやExcel文書を配布すればよいかというと、資料として読みたいときに難が生じるでしょう。PDFと元データを別に分けて配布となるとPDFと元データの関連を保持するのが少々手間になってくるかもしれません。ではここで述べる「再利用しやすいPDF」が何を指すかというと、「PDFに含まれる表の元データを含むPDF」のことになります。

PDFには添付ファイル、そしてファイル添付注釈を付加することが可能です。弊社PDF資料室に資料があります*2
資料室のページにはMicrosoft WordファイルやExcelファイルを添付するスクリーンショットが掲載されています。

*2で分かるように、.docxや.xlsxファイルをPDFに添付しておくことで、閲覧性と検索性を確保しつつ、添付した元ファイルからデータの再利用などが容易になります。元ファイルを含む分、どうしてもファイルサイズは大きくなります。そうなると、あまり規模が大きなファイルではなく、かつ元データがあると嬉しいPDFのファイル添付に向いた用途は表データの他にあるでしょうか。思いついたのプログラミング関連書PDFへのソースコードの添付です。

私は休日に個人で同人誌制作などをしており、電子版をPDFとして頒布なども行っています。
プログラムサンプルのソースコードをすべてページに表示すると結構なページ数を取りますし、読者も数ページのコードをコピーアンドペーストするのは手間です。こうしたソースコードについてよく取られる方法としては、Web上にソースコードをアップしてそのURLを掲載したり、PDFファイルとソースコードファイルを一緒に含めてzipファイルで一緒に頒布するなどがあります。

そこでPDFへ、文書内で言及しているソースコードを埋め込むとどうでしょうか。ファイル添付注釈では、ファイルがどこに関連するものであるのかをページ上で示すことができるため、多くのソースコードや表を伴うような技術書では有用ではないかと考えたりしています。

これは1つの案ですが、他にも今の業務や趣味を少し楽にするため、PDFへファイル添付を行うと嬉しい事例があるかもしれません。


アンテナハウスではPDFへのファイル添付を行えるソフトウェアを販売しています。
瞬簡PDF 編集*3で作成したPDFにファイルを添付、編集、削除などが可能です。
瞬簡PDF 作成*4ではWord文書からPDFを作成するときにWord文書を添付することが可能です。

ほか、PDFファイル添付機能をシステムに組み込むことを可能にするAntenna House PDF Tool API*5 をご用意しています。ファイル添付プログラムの例やその他さまざまな利用法をまとめた『PDFの料理本!PDF CookBook シリーズ』*6も合わせてご覧ください。

参考資料

*1 PDF資料室
*2 PDFをコンテナーとして活用する~PDFの添付ファイルとファイル添付注釈~
*3 瞬簡PDF 編集 9
*4 瞬簡PDF 作成 9
*5 PDF Tool API
*6 PDFの料理本!PDF CookBook シリーズ




アウトライナー
PDFを解析して しおり・目次を自動生成


瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識

ふるさと納税返礼品の初出荷!!!

真冬らしい厳しい寒さが続く中、アンテナハウスでもふるさと納税返礼品の初出荷がありました!!

ありがとうございます!!

ふるさと納税寄付先は、出身地や以前居住したことのある地域に限らず、「応援したい」地方公共団体を自由に選ぶことができます!

さて、アンテナハウス伊那支店・商品センターは長野県上伊那郡南箕輪村に位置しています。



アンテナハウスのデスクトップ製品を南箕輪村ふるさと納税返礼品として登録しています*

南箕輪村には魅力あるものがいっぱい!!
さっそくご紹介していきます!!

特産品

【大芝高原いちご】
水耕栽培技術と長い日照時間で育った南箕輪村大芝区のいちごはビタミンCがたっぷり! 章姫と呼ばれる、大粒で糖度が高く、酸味の少ない品種とのこと。

大芝高原いちごではありませんが、ブログ記事「新製品発売DVDと大きな・・・・」に長野県のいちごの写真がありました。

【コシヒカリ「風の村米だより」】
まっくんファームを中心に上伊那農業高等学校や信州大学農学部、JA上伊那、村役場などが協力し栽培している特別栽培米(有機・減農薬栽培)。
初見のインパクトが大きな「まっくん」は南箕輪村のイメージキャラクター。このブログでは「大芝高原」の回でその姿が登場しています。
【りんご】
寒暖の差が激しく日照時間が長い南箕輪村のりんごは、信州のりんごの中でも 色付き、味がよく美味しい!
様々な種類のりんごが育てられています。これらを加工したジュースやジャムもあります。

他にもブルーベリー、わさび、白ネギ、アスパラガスなどがあります。

教育

日本の村で唯一、国立大学が存在する村であり、小学校から大学までの教育機関が存在する村です。

大学は信州大学の農学部が南箕輪村にあり、先述のお米など、村と協力し様々なチャレンジをしています。
「川下り米」の回ではこの信州大学農学部の教授の方が伊那市各地の米の成分分析をされた話などについて触れていますね。

祭事

田畑半沢ほたる祭り(6月中旬)
大芝高原灯ろうまつり(7月上旬)
信州大芝高原まつり(8月下旬)
信州大芝高原イルミネーションフェスティバル(10月)
南箕輪村産業祭(10月下旬)
落葉松祭(信州大学農学部学園祭、11月下旬)など

南箕輪村は子育て世代の転入が多く、県下一若い村として注目されており農・工・商・住宅地が調和のとれた発展を続けています。

そんな魅力あふれる南箕輪村へどうぞみなさんお越しください(*^-^*)




瞬簡PDF 変換 2024
PDFをOffice文書へ高精度変換


瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品!

環境の大掃除

2021年となりました。今年もよろしくお願いします。
年末年始の外出を控えたためか、個人的にはあまり新年という感じがしていませんが。アンテナハウスも4日から営業しています。

私は年の区切りくらいを目安に、大掃除をしています。家の大掃除ではなく、開発環境の大掃除です。業務用の環境ではそうもいきませんが、プライベートの計算機はOSのクリーンインストールまでしていたりします。一定期間でシステムを一新することを「式年遷宮式」と呼ぶこともありますが、そこまで大袈裟なことはしていません。ただ、何度か行っていると「今なくすと困るもの」「なくすと後で後悔しそうなもの」「常に必要になるもの」など、日常で分類をしつつ作業を心がけるようになってきました。パスワード類はパスワード管理ソフトに、画像ファイルはクラウドストレージ上で分かりやすいように、といったこともあります。もっと素朴には、デスクトップ画面に使っていないファイルのアイコンがいっぱい……というのはあまり落ち着かないので。

しかしより重要なのは自分用の開発環境構築です。

依存ライブラリの競合や以前の開発の残骸による意図しない動作など、ある開発環境を掃除せず使い続けるのはなかなかリスキーです。自分用にカスタマイズした環境について一番把握している(べき)なのは自分ですから、「分からなくなってきたらリセットする」くらいの気持ちでいます。緊急性が無ければ実際に再構築するまで時間を置くことで、引き継ぐべき情報の洗い出し、次の環境で試行することの設定などを行います。

近年はローカルの開発環境もかなり調えやすくなったと感じています。
ラップトップ計算機のストレージに余裕ができたのでローカルでもDockerコンテナを多数置けたり、WSL2でWindows上でLinux環境が楽にテストできたり、Windowsでもサンドボックスが簡単に扱えるようになりました。エディタもVSCodeでインストールしているプラグイン環境を他の計算機のVSCodeに持っていったりと、プライベート用途程度であれば「天気が良いからOSをクリーンインストールしよう」くらいにハードルが下がってきたように思います。

一方ドキュメント環境はあまり調えられていません。個人的な抱負ではありますが、少しでもこれを向上させることを今年の目標とします。





瞬簡PDF 変換 2024
PDFをOffice文書へ高精度変換


瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識

情報充実の冬

プライベートでアドベントカレンダー(12月1日から25日までを数えるために使用されるカレンダーで、箱などを用意して窓を毎日ひとつずつ開けていくもの。から派生した25日間(あるいはそれ以上)ブログ記事などを毎日投稿、公開していくWeb上のイベント)を続けています。そう長い歴史があるわけではありませんが、技術記事の検索などをするとこの時期に書かれたものが結構あります。

アンテナハウスにはアドベントカレンダーの風習は今のところありませんが、技術情報、製品情報の充実には力を入れています。隔週火曜に定期開催しているウェビナーもその1つですね。

年内の残りのウェビナーは2つ、本日12月8日と、12月15日ですね。



※終了しました。

ウェビナーの内容を編集し後日動画で公開なども行っています。開催時間の都合上参加が難しい方も、アンテナハウスのYouTubeチャンネルに登録いただくと新着動画情報が分かります。

各製品ページやその他のページも随時更新されています。直近でも色々追加されているようです。




瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品!


瞬簡PDF 作成 2024
ドラッグ&ドロップでPDF作成

ドキュメント技術関連の日本語動画はあまりない?

つい先日、有名なLaTeX入門書の第8版が発売されました*1。私は6版の頃から購入していますが、新しい項目の追加もされており、旧版をお持ちの方もおススメです*2。使い方なども含めて時代に合わせた内容のアップデートの大切さも教えてくれる書籍です。基礎的、原理的な内容を扱ったものではないのに20年近く内容が更新されながら販売され続けている書籍というのはかなりすごいことだと思います。

ところで2000年頃は結構出版されていたXMLについての書籍はほとんど見なくなりました。「XMLが廃れた」というよりは「XMLを手書きする機会が減った」あるいは「基本を覚えた後はIDEのガイドに従うだけで済むくらいにツールが成熟した」ということの結果かもしれません。

いやいや「現代はみんな動画で情報を得ようとしているのかも」とYouTubeで「XML」を検索してみると、そこそこの件数が表示されました。しかし「PDF」で調べたときに比べるとかなり少ないようです。PDFはPDFで単語が検索にひっかかるものの話題がかなり異なる「ノイズ」が結構あったので軽く調べた程度ではちゃんとした数字を出すのは厳しいですが*3、PDFと比べ世間的な関心はやはり薄いのかもしれませんね。ちなみに「XSL」「XSL-FO」になると英語での結果を含めてもかなり限られる、というより日本語の動画がほとんどありません。

そんなPDFにしても、「このツールを使えばできます!」という内容がほとんどになり、「なぜかPDFという形式を使わなきゃいけないみたいだけど、なぜPDFがいいんだろう」といった技術的な話題を取り扱っているものはあまり見ません。「明日提出しなければいけない書類を前にそんな内容は観ていられない」というのはそうかもしれませんが、今の情勢は、そんな間に合わせの状況を変える転換点にきているのかもしれません。とりあえずの問題を解決するための「ツールの使い方」も大切ですが、より効率的に、根本的に問題を解決するためには技術そのものへの理解も重要です。「日本語で弊社の得意とするドキュメント関連の技術をしっかり動画で解説してほしい」というご要望がありましたら、ぜひ声をお寄せいただければ幸いです。

弊社PDF関連製品の使い方やウェビナーの過去回をまとめた動画を公開しています。

*1ですが、最初に付録の参考書籍一覧を見たとき「こんなのもう手に入らないだろう」と思っていたのに、気が付けば6割近くを所有していたり。一方で10年前にはフリーで配布されていた組版ソフトウェアの情報の方が手に入りづらかったりして歯がゆく思う今日この頃。

  1. *1 『[改訂第8版]LaTeX2ε美文書作成入門』(奥村晴彦,黒木裕介 著, 技術評論社, 2020-11-14, ISBN 978-4-297-11712-2)
  2. *2 TeXの始まりから数えれば40年くらい歴史あるものでも「枯れた」とは限らないのがソフトウェア(LaTeXについては今年かなりの大変更が入ったりしています)
  3. *3 LaTeXはLaTeXで組版と関係ないLatexが結構混じってくるので大変検索しづらいです

P.S. 記事を書いた後「記事タイトルはこれでいいんだろうか」と悩み、DITAやS1000D、SphinxやPerlDocなども検索してみましたが、タイトルは変えなくて良さそうでした。




HTML on Word
WebページをWordで作る!


アウトライナー
PDFを解析して しおり・目次を自動生成

「PDFは編集できない」って? ちょっとちょっと政府CIOの皆さん、その認識はぜひ改めていただきたい。

菅内閣目玉の政策として「デジタル庁」があります。デジタル庁は現在準備室が発足し、来年(2021年)の発足を予定しているようです。IT技術をつかってデジタル化を図るには、共通化やポータル化が必須なので、強い権限をもつデジタル庁を作るのは適切な考え方でしょう。

ところで、これに関連し、政府CIOポータルに「デジタル・ガバメント実行計画」というページがあります。

デジタル・ガバメント実行計画

全文(PDF)

この資料、PDFファイルで全215ページなのですが、検索すると、その中にPDFについて言及している箇所が2か所あります。

◎1か所目(p.56)

「(d)編集可能な電子ファイルによる申請書様式の提供
利用者が行政手続を行う際の利便性向上のため、当該行政手続に係る情報をWebサイト等で容易に入手でき、かつ、Webサイトの入力フォームを利用して直接申請書の作成を可能とする又は申請書様式の電子ファイルをPDF などの編集不可な形式ではなく、編集可能な形式の電子ファイルで入手可能とする。」

◎2か所目(p.75)

「また、業務上使用する文書等について、デジタルデータで作成された文書であっても、文書交換を行う際には紙媒体や PDFファイルなどの編集等が困難な形で流通しているなど、業務が非効率になっている場合がある。また、各府省のWebサイトで公開されている資料についても、編集が不可な状態のものや、資料のステータス(日付、会議名、担当府省等)が不明なものも散見される。」

これを読むと、PDFは編集不可、あるいは編集困難とされています。どうやら、デジタル政府では、申請書などはPDFファイルで用紙を配布するのはやめて、Webサイトの入力フォームを推薦したいようです。

では、実際のところ、PDFファイルは編集できない・編集困難なのでしょうか? 次のような事情を考えると、「デジタル・ガバメント実行計画」のPDFファイルに関する記述は、現在では適切ではないと思われます。

PDFは編集できるという事実
第一に、現在市場には、非常に多様なPDF編集ソフトが流通しています。有名どころは某A社製品ですが、アンテナハウスでも『瞬簡PDF編集』を販売しています。

第二に、アンテナハウスの『瞬簡PDF 書けまっせ』のように、PDFを紙のように見立てて、PDFファイルの上に文字を重ねて書きこむ(追記)ソフトも増えています。

第三に、PDFで申請用紙を作る形式として、PDFフォームがあります。PDFフォームを使えば、特別なツールを使わなくても、PDFフォームに文字を書きこむことができます。「PDFフォームとはなにか? 申請のデジタル化にPDFフォームの活用を期待する

Webフォームも良いですが、Webフォームはサーバーサイドの用意も必要であり、大きな開発工数や保守工数がかかります。また、専門家でないと多様なフォームを作るのは難しいので、非常に多岐にわたる形式のフォームを誰でも簡単に作成して配布するのはWebフォームでは難しいと考えられます。PDFをもっと活用する方が効率的でしょう。

ぜひ、政府CIOの方々には認識を改めていただきたいものです。


shunkan pdf henshuu
shunkan pdf kakemasse
tyotto hitoiki antenna house webinar



瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品!


瞬簡PDF 書けまっせ 2024
PDFに文字が書ける! 入力欄を自動認識

fo:bookmarkというマークアップから考えるしおり

『岩波国語辞典第八版』*1によれば、「しおり(しをり)」には2つの意味があります。

1. 本の読みかけのところに挟んで目印とするもの 2. 初めての人などにわかりよく説明した本。手引き

岩波国語辞典第八版

「目次」は次のように記されています。

(書物の)内容の題目を、書かれている順に並べて記したもの

岩波国語辞典第八版

しおりについて、1の意味では、読み手側が設定するものという印象が強いですね。ちなみに岩波国語辞典だとブックマークはWebブラウザのブックマーク(お気に入り)機能についての言及となっています。

さて、XML組版の仕様であるXSL1.1仕様にはしおりを作成するための機能fo:bookmarkfo:bookmark-titlefo:bookmark-treeが存在します。1.1の仕様に1.0との差異が記載されているのですぐにわかりますが、実は1.0のときには存在しなかった機能です*2

『XSL-FOの基礎 第2版』*3にしおりのFOについての解説があります。また、Antenna House XSL Formatterの*4サンプルFOのページ*5からしおりの設定されたPDFを確認できます。

<fo:layout-master-set>
    …略…
  </fo:layout-master-set>
  <fo:bookmark-tree>
    <fo:bookmark internal-destination="MARK001">
      <fo:bookmark-title font-weight="bold">
    目次</fo:bookmark-title>
    </fo:bookmark>
    <fo:bookmark internal-destination="MARK002"
                 starting-state="hide">
      <fo:bookmark-title>第1章</fo:bookmark-title>
      <fo:bookmark internal-destination="MARK003">
        <fo:bookmark-title>1.1</fo:bookmark-title>
      </fo:bookmark>
     ...
     </fo:bookmark-tree>
     ...
    <fo:page-sequence ...>
      <fo:block font-size="2em" font-weight="bold" space-after="5mm" id="MARK001">Bookmark sample-1</fo:block>
        <fo:block font-size="1.5em" font-weight="bold" id="MARK002">Lorem Ipsum</fo:block>
          <fo:block space-before="4mm" margin-left="2em" line-height="1.4">
         <fo:block keep-with-next="always" font-weight="bold" id="MARK003">Lorem ipsum dolor sit amet</fo:block>
            <fo:block>...</fo:block>
        </fo:block>
...
</fo:page-sequence>

ごく簡単に説明すると、fo:rootの子としてしおりのツリーを用意し、その子として、目的のIDやURLなどをプロパティの値に持つしおりfo:bookmarkとしおりの項目名fo:bookmark-titleを記述します。上の例ではfo:blockにそのIDが記述されていますね。ツリー構造ですので、階層も表現できます。

PDFなど、ページドメディアへの出力を意識したマークアップであるXSL-FOの機能として用意されていることから分かる通り、これは文書コンテンツ提供側が用意するしおりです。
XSL-FOは(中間形式にせよ)ページドメディアとしてかなり明示的なマークアップを求めますから「fo:bookmark*」は「この箇所をしおりとする」というはっきりとした意思表示となります。
文書コンテンツ作成者がコンテンツ頒布時に「この部分は読みかけ」というしおりを作ることは稀なことと捉えて良いでしょう。そして、fo:bookmark-titleというマークアップ名から分かる通り、しおりの項目名は長い段落などを記述する箇所でもありません。

目次項目は当然その項の内容を反映しまとめたものになりますから、しおりは多くの場合目次項目と同じ箇所でマークアップされ、対応したPDFビューアーでは「しおりを表示」といった機能でページ表示とは独立して表示できます。
特に数百、数千ページのPDF文書を頻繁に読む機会のある方は頷かれるのではないかと思いますが、紙の文書ではそれこそ「しおり」を挟んで分厚いページの束をまとめてむんずと掴んで目次に戻ったりできますが、PDFビューアー上で毎回目次ページへ戻って目次項目を確認するというのはそこそこ時間がかかります。

個人的には、しおりの重要な点として「ページ外の要素」であることが大きいのではないか、と考えています。目次で「2.3 詳細 200ページ」、文章中に「299ページに詳細」、索引ページに「fo:bookmark…300p」といったページ参照があるのはそれはそれで重要ですが、「本文を読みながら文書(あるいは文書外)の他の箇所への目印へすぐにアクセスできる」機能がしおりといえるのではないでしょうか。そして、XSLでは文書コンテンツ提供側がそれを提供することになります。

ところで、XSL-FOとXSL-FOプロセッサーによる処理ではPDFの作成時にしおりをマークアップすることになるので、すでにPDFとなっているものにしおりを付与することは範囲外です。Antenna House Formatterでは「PDFを画像のように埋め込む」といったことができるので、多少トリッキーな方法で後からしおりを付与することもできなくはありません。しかし専用のソフトウェアがあればもっと分かりやすく、そして効率的にしおりを付与できます。

antenna house webinar pdf bookmark

隔週で火曜に開催している「ちょっと一息 アンテナハウスウェビナー」、11月10日(火)16時からは「そもそも、PDFのしおりとはなにか ~目次と何が違うのか。どう作って活用するか~ 」というテーマでお送りします。この記事を書いているのが担当者でないため、発表内容の詳細はわかりません。しおりってなんなんでしょうね……。この謎を明かすためにも明日のウェビナーは必見です。

参考文献・資料

  1. *1 『岩波国語辞典第八版』(岩波書店, 2019年11月22日第1刷発行, ISBN 978-4-00-080048-8)
  2. *2 https://www.w3.org/TR/xsl11/#change10
  3. *3 https://www.antenna.co.jp/AHF/ahf_publication/data/xsl-fo-v2/201603282131.html『XSL-FO の基礎 第2版 – XML を組版するためのレイアウト仕様』(アンテナハウス株式会社, 2017年3月, ISBN 978-4-900552-48-7)
  4. *4 Antenna House Formatter
  5. *5 https://www.antenna.co.jp/AHF/ahf_samples/sample-fo.html#pdf




瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品!


瞬簡PDF 変換 2024
PDFをOffice文書へ高精度変換

会議記録ってActivityStreamsなのでは

先日、社内の会議で議事録を担当する機会がありました。
「議事録」と呼ばれる形では読みやすさのために不必要なものを省くことも必要ですが、最終的な議事録として整形する以前の状態として、会議の記録は詳細に記録しておくにこしたことはありません。

音声記録を取ってそこから書き起こすにしてもSpeechToText技術で自動文字起こしをしたり、書記を指定せず会議中に共同編集ファイルに記録していくなど、ここ数年で普及が進んだ技術をフル活用することもできるでしょうし、その導入コストやセキュリティリスクと従来の方法を天秤にかけて後者を選ぶこともあるでしょう。

さて、さまざまな制限があるとき「何を記録するか」という観点が重要になります。
この取捨で落ちた情報は(推測や関連情報の補完といったことは考えられますが)基本的に復元できません。

会議開始前に用意できる情報としては次のようなものがあるでしょう。

* 会議の題目
* 日時
* 出席者、欠席者
* 事前資料

会議の流れがある程度決まっているのであれば、あらかじめ枠組を用意しておき、内容をある程度カテゴライズできます。

そういった事柄は先でも後でも良いとして、主題は会議の内容自体の記録です。
会議終了後議事録を再構成することを考えると、落としたくない内容は次のように整理できます。

* 発言者
* 発言内容
* 発言の文脈(前後関係)
* 提示資料

文脈についてはもう少し分ければ「何についての発言か」「誰に対しての発言か」「会議のどのタイミングでの発言か」といった情報になります。
また、会議のタイミングに関連して、会議そのものではないものの「途中退室」「一時中断」といった情報も記録できた方がよいかもしれません。

さて、発言者やタイムスタンプ、発言内容といった内容に加えて、さまざまな出来事を記録するための標準仕様は何でしょうか? そう、W3CのActivityStreamsです。

ActivityStreamsは2017年に2.0がW3C Recommendationとなった、ユーザーのメッセージ投稿、フォロー、などのActivityを記録するための形式です。原型としてはユーザーフィードの形式であるAtomを拡張していますが、2.0ではJSON Linked Data(JSON-LD)を基本エンコード形式としています。

ActivityStreamsとして規定されているのはデータ形式としての仕様までで、
このActivityStreamsを採用する分散SNSプロトコルとしてActivityPubがあります。
ActivityPubの実装としてはMastodonなどが有名ですね。

分散SNSの概念説明などをするととても長くなってしまうため割愛しますが、分散SNS用プロトコルについて短くまとめると「プロトコルを共通にすれば他のサービスと共通のインターフェースでやりとりできる」という、標準仕様の利点をSNSにも適用したもの、といえるでしょうか。

ActivityStreams以前にもメッセージングの共通プロトコルはXMPPなどあったわけですが、
これは「JSON-LDを基本エンコード形式とする」点、「メッセージに留まらないActivityを記録する」点など、マイクロブログやチャットに留まらないSNS全般とインターフェースを持てるように設計されています。それこそ議事録なども含めてActivityStreamsに落とし込んだ企業製品もすでにあるようです(記事執筆中に初めて知りました)。

話を戻して、会議の記録とActivityStreamsのマッピングについて考えてみましょう。
疑似的なものなので、typeの指定などが必ずしも適切なものになっていない場合があります。
厳密にはURIであるべき箇所などもあります。

会議中の1つの発言をActivityStreamsで表してみます。

{
  "@context": "https://www.w3.org/ns/activitystreams",
  "summary": "上司1の発言",
  "type": "Create",
  "actor": {
    "type": "Person",
    "name": "上司1"
  },
  "object": {
    "type": "Note",
    "name": "上司発言1",
    "content": "会議を始めます"
  },
  "published":"2020-10-26T15:00:00Z"
}

@contextはJSON-LDでのXML名前空間のようなものとして捉えてください。
typeなどは、コアの部分とは別に規定された語彙を用います。
actorはそのactivityを行う主体、ここでは「上司1」というPersonですね。
「上司1がNoteというタイプのObjectをCreateした」ことで「上司1が発言した」ことが表せるというわけです。

選択式の質問を行った場合をみてみましょう。

{
  "@context": "https://www.w3.org/ns/activitystreams",
  "name": "質疑応答2",
  "id": "shitsugi2",
  "type": "Question",
   "content": "昨日の朝はごはんとパンどちらを食べましたか?",
   "oneOf": [
     {"name": "ごはん"},
     {"name": "パン"}
   ],
   "replies": {
     "type": "Collection",
     "totalItems": 3,
     "items": [
       {
         "attributedTo": "上司1",
         "inReplyTo": "shitsugi2",
         "name": "ごはん"
       },
       {
         "attributedTo": "部下2",
         "inReplyTo": "shitsugi2",
         "name": "パン"
       },
       {
         "attributedTo": "部下1",
         "inReplyTo": "shitsugi2",
         "name": "パン"
       }
     ]
   },
   "result": {
     "type": "Note",
     "content": "昨日の朝、ごはんを食べたのは1人、パンを食べたのは2人ですか。"
   }
 }

大本のオブジェクトがQuestionタイプ、そして択一の選択肢oneOf、その回答をrepliesのCollectiontとしています。attributedToはここでは回答者、inReplyToが何に対しての回答なのかを表します。resultとして回答の結果に言及しています。

「会議3」に途中参加の人「同僚1」がいたことを表してみます。

{
  "@context": "https://www.w3.org/ns/activitystreams",
  "summary": "同僚2が途中参加",
  "type": "Join",
  "actor": {
    "type": "Person",
    "name": "同僚2"
  },
  "object": {
    "type": "Group",
    "name": "会議3"
  },
  "published":"2020-10-26T15:00:00Z"
}

3つほど例を作ってみました。全てとはいいませんが、大部分のことはActivityStreamsで規定された範囲で表せそうな感じがありますね。

オンライン会議が身近になったことで、会議や議事録作成の機会が増えた方もいるかもしれません。
より効率的にできるところは進めていく、その第一歩は「物事をふさわしい枠にはめる」ことではないかと思います。もちろん上のように生のJSONを記述するのは非効率ですが。
そんな視点から、標準仕様を読んでみるのも面白いのではないでしょうか。

さて、「PDF作成でも用途にふさわしい作り方があるのでは」ということで、2020年10月27日(火)16時からウェビナーで「PDFお助け便利帳『無料で作るPDF 3つのポイント+活用ノウハウ3選』」をお送りいたします。

参考資料




アウトライナー
PDFを解析して しおり・目次を自動生成


瞬簡PDF 統合版 2024
アンテナハウスPDFソフトの統合製品!
Pages: Prev 1 2 3 4 5 6 7 8 9 10 ... 111 112 113 Next