資料名:資料9 NHK放送技術研究所・メディア開発企画センター提出資料 タイトル:NHK 3つの実証実験について (スライド1枚目) NHKでは、ユニバーサル・サービスの拡充をめざして、さまざまな技術開発を進めています。本日は、この秋から始めている3つの実証実験について説明します。 1.自動生字幕放送トライアル 2.天気・防災手話CG試験提供 3.スポーツ中継での解説音声制作・配信 メディア開発企画センター、放送技術研究所の担当者から説明します。 (スライド2枚目) 自動生字幕放送トライアルについて説明します。 地域放送局では、字幕を制作・送出する設備整備や専門技能を有したオペレーター確保が課題となっています。そこで、AI音声認識装置を活用した自動生字幕放送によって、地域放送局の字幕サービス拡充を図りたいと考えています。 今回のトライアルは大阪放送局で実施します。実施期間は、10月31日の月曜日から11月25日の金曜日まで、土日祝日をのぞく平日の4週間です。放送時間は1日当たり2回。午後0時15分から0時20分放送のニュースと、午後3時7分から3時10分のニュースです。放送エリアは近畿ブロックで、大阪、京都、兵庫、滋賀、奈良、和歌山で、ご利用いただけます。 実施要領を説明します。今回のトライアルでは、音声認識装置で変換した字幕をそのまま放送します。オペレーターによる修正はおこないません。 より正確な字幕をお伝えするために、変換精度が高いアナウンサーの読み上げのみ字幕を付けます。インタビュー等フリートークでは変換精度が低下する傾向にあるため、字幕を付けず、テロップをオープンキャプションとして内容を伝えます。 また、音声認識装置の学習データを、過去2年分から過去10年分に増強し、変換精度を向上しています。 ? 今回のトライアルでは、全日本ろうあ連盟や全日本難聴者・中途失聴者団体連合会など多くの団体にご協力をいただき、利用意向調査を実施する予定です。みなさまのご意見を参考に、サービス向上をめざしたいと考えています。 (スライド3枚目) では、自動生字幕放送のサンプル動画をご覧いただきます。サンプルは、2020年に秋田放送局で制作した番組「ニュースこまち」です。音声認識装置によりリアルタイムで字幕を付与しました。 (動画1分30秒) 続いて東北地方の話題です。山形です。鶴岡市にある加茂水族館の人気者、オスのゴマフアザラシの将兵が、茨城県の水族館に譲渡されることになり、けさ茨城に向けて出発しました。小平は、大リーグエンジェルスの大谷翔平選手にあやかって名付けられ、人気を集めていました。近親交配を避けるために引き受け先を探したところ、茨城県の水族館に決まりました。新型コロナウイルスの影響で、引っ越しは当初より3か月遅れたということです。小平は、大きなかごから輸送用の車に移される最中おとなしく、職員たちは別れを惜しんでいました。 (インタビュー2人には字幕はありません) 小平は茨城県の水族館に到着したあと、環境に十分慣れてから公開される予定です。 (動画1分30秒終わり) アナウンサーの読み上げが正確に字幕に変換されていたことを確認できたと思います。 アザラシの名前「しょうへい」は、本来ひらがなですが、漢字に変換されていました。固有名詞については、事前に音声認識装置に学習させることで、正確に変換することが可能です。 今後も音声認識の精度向上を図りながら、地域放送の字幕サービス向上に努めたいと思います。 (スライド4枚目) 続いて天気・防災手話CGについて説明します。 このサービスは、大雨特別警報や津波警報など、気象庁から発表されたデータをもとに、手話CGを自動生成し、24時間365日、災害時にいち早く避難・警戒をよびかける取り組みです。 10月3日からインターネットサイト「天気・防災手話CG」で試験提供をスタートしました。 10月14日に、東京都(青ヶ島)に土砂災害警戒情報が発表された際には、手話CGで避難や警戒をよびかけました。 手話CGによるサンプル動画を用意しました。宮城県に土砂災害警戒情報が発表されたという想定です。 (動画1分3秒) 宮城県に土砂災害警戒情報が発表されました。土砂災害の危険性が非常に高くなっています。大雨となっている地域では警戒してください。雨がやんでいるところでもこれまでの雨で地盤が緩んでいます。周囲の状況を確認して早めの避難を心がけてください。 (動画1分3秒終わり) このように、どこに、どんな警報が出ているのか、どんなことに警戒すべきかを、1分から2分程度で繰り返し伝えることにしています。 (スライド5枚目) この「天気・防災手話CG」はNHKのホームページ「NHKオンライン」や、「ニュース・防災」アプリからアクセスできます。平時は、全国の気象情報を配信し、災害時は、防災情報を手話CGで配信しています。 「天気・防災手話CG」についても、全日本ろうあ連盟や全難聴のご協力を頂き、利用意向調査を実施する予定です。みなさまのご意見を参考にしながら、サービス向上を図りたいと思います。 (スライド6枚目) 続いて、スポーツ中継での解説音声制作・配信について説明します。 テレビ放送におきましては、視覚に障害のある方々に番組をより楽しんでいただくために、映像に関する説明を、副音声によるナレーションで伝える解説放送を実施しております。 しかし、解説放送のほとんどは収録番組であり、生放送番組には解説音声が付与されていないのが現状です。 特に、スポーツ中継での感動を、障害の有無によらず共有したいという声をいただいております。 (番組表のスクリーンショット) 10月14日にNHKが放送した解説放送番組のスクリーンショットの一部を表示。探検ファクトリー、キソ英語、チョイス、連続テレビ小説「舞い上がれ」、グレーテルのかまど、の5番組。全て収録番組で、生放送番組は含まれていない。 (番組表のスクリーンショット終わり) (写真) テレビでスポーツ中継を見ながら男性二人が盛り上がっている様子。内一人は視覚障害者。写真下部に「スポーツ中継での感動を障害の有無によらず共有」のテキスト表示。 (写真終わり) (スライド7枚目) そこで、NHK放送技術研究所では、スポーツ中継の試合状況を解説する音声を、利用者のスマホにリアルタイム配信する「解説音声制作・配信システム」を開発しています。 例えば、野球中継でテレビ画面にスーパーされている得点やボールカウント、ピッチャーが「構えた」、「投げた」などの選手動作に関する情報は、画面から視覚的に伝わるため、アナウンサーが話すことはほとんどありません。 そこでこのシステムは、アナウンサーがあえて話さない、テレビ画面から得られる視覚的な情報を利用者のスマホに配信し、解説音声として提供します。 具体的には、まず放送局側で手動、もしくは自動で「ピッチャー構えた」などの解説テキストを制作します。 画面にスーパーされている球速やボールカウントなどは、文字認識により自動的に「球速145キロ」などの解説テキストに変換します。 制作した解説テキストを、クラウドサーバにて音声合成処理を施し、配信サーバから音声データとして利用者のスマホに配信します。 ご家庭では、テレビの音声と合わせてスマホからの解説音声をお聞きいただけます。 ? (システムのフロー図) 本フロー図は、左側、中央、右側の3つのパートで構成されている。 図左側は、放送局で解説テキストを手動入力と自動入力で制作する様子。上段には、スポーツ映像を見ながらタブレットを手動操作するオペレーターの写真。下段には、スポーツ映像から球速の画面スーパーを文字認識し、「球速145キロ」の解説テキストを制作しているノートパソコンのイラスト図。 図中央は、解説テキストが解説音声に変換され、家庭に届くまでの処理を示したブロック図。手動入力、自動入力で制作された解説テキストが、音声合成サーバおよび配信サーバに送られ、解説音声に変換されて家庭のスマホに届くまでの流れを図示。 図右側は、家庭で解説音声を聞きながらスポーツ中継を視聴する利用者のイラスト図。テレビから「速い球を見逃した」と発話している吹き出し、スマホから「球速145キロ」と解説音声を発話している吹き出しを表示。 (システムのフロー図終わり) このシステムの有効性を評価するため、今年のプロ野球日本シリーズで10月23日から29日まで、NHKで放送した試合について、解説音声の配信実験を行いました。 視覚障害者を含む36名の方々にご参加いただき、テレビの野球中継と合わせてスマホからの解説音声をお聞きいただきました。 現在、参加者からのアンケート結果を分析しておりますが、解説音声に求められる情報を精査し、解説テキスト制作のさらなる自動化を進める予定です。 また、実サービス開始に向け、アプリの機能やサーバの配信機能を強化していきたいと考えております。 以上、3つの実証実験についての説明でした。NHKでは引き続き視聴者のみなさまのニーズに寄り沿い、ユニバーサル・サービスの拡充をはかっていきたいと考えています。