視聴覚障害者等向け放送の充実に関する研究会 第1回 議事要旨 1 日時:令和4年11月1日(火曜日)10時から12時まで(途中休憩あり) 2 場所:Web会議による開催 3 出席者 (1)構成員 音座長、山下座長代理、岩下構成員、近藤構成員、世木構成員、吉田構成員、新谷構成員(全日本難聴者・中途失聴者団体連合会)、 原田構成員(日本障害者リハビリテーション協会)、堀米構成員・瀬川氏(全日本ろうあ連盟)、三宅構成員(日本視覚障害者団体連合)、 小原構成員(NHK)、矢口構成員(日本テレビ)、竹内構成員(TBSテレビ)、正岡構成員(フジテレビ)、二階堂構成員(テレビ朝日)、 上野構成員(テレビ東京)、八木構成員(毎日放送)、土屋構成員(中京テレビ)、秦構成員(広島ホームテレビ)、菅野構成員(BSフジ)、 長谷構成員(J SPORTS)、岡本構成員(衛星放送協会)、二瓶構成員(日本ケーブルテレビ連盟) (2)オブザーバー 内閣府 政策統括官(政策調整担当)付参事官(障害者施策担当)付、 厚生労働省 社会・援護局 障害保健福祉部 企画課 自立支援振興室、 一般社団法人電子情報技術産業協会 (3)議題(3)の説明者 NHK 花輪氏(メディア戦略本部)・大蔵氏(メディア開発企画センター)・高橋氏(放送技術研究所 スマートプロダクション研究部)、 ヤマハ株式会社 森口氏 (4)総務省 山碕大臣官房審議官、林情報流通行政局総務課長、飯倉放送政策課長、松井地上放送課長、安東衛星・地域放送課長、 金子地域放送推進室長、福田地上放送課企画官、澤谷地上放送課課長補佐 4 議事概要 (1)開会 小笠原情報流通行政局長を代理して、山碕大臣官房審議官から開会の挨拶があった。 総務省では、放送法等に基づき、視聴覚障害者等向け放送の普及促進に向け、多くの関係者の協力を頂きながら、継続して取り組んでいる。 そうした中で、2018(平成30)年に策定された「放送分野における情報アクセシビリティに関する指針」は、字幕放送、解説放送、手話放送に関して、 放送事業者による10年間の普及目標を定めており、その中間にあたる5年後の今年度を目途に中間見直しを行うこととされている。 本研究会は、有識者、障害者団体、放送事業者等に参画いただき、当該指針の見直しに係る検討を行うことを目的の1つとしている。 昨今、新型コロナウイルス感染症拡大や、自然災害の多発により、緊急時における速やかな情報伝達が喫緊の課題となっており、 情報伝達における放送の役割は一層重要なものになっている。また、本年5月には、 議員立法により「障害者情報アクセシビリティ・コミュニケーション施策推進法」が成立するなど、情報アクセシビリティの向上について、 政府全体として一層の取組が求められているものと認識している。 このような状況も踏まえ、今後の視聴覚障害者等向け放送の充実に関する施策の企画・立案に資する有意義な議論をよろしくお願いしたい。 (2)座長及び座長代理の指名 資料1の開催要綱に基づき、構成員の互選により、音構成員が座長に指名された。また、音座長から山下構成員を座長代理に指名した。 音座長挨拶 今回の「放送分野における情報アクセシビリティに関する指針」の見直しによって、 より多くの方々が放送サービスを楽しむことができる環境ができるようにしたいと思っている。 山下座長代理挨拶 研究会では、音座長を補佐し、実り多い成果が得られるよう努めてまいりたい。 (3)開催要綱及び今後のスケジュール 事務局から、資料1「開催要綱」及び資料2「今後のスケジュール(案)」に基づき説明。 (4)−1 議題(1)視聴覚障害者等向け放送の状況 事務局から、資料3「視聴覚障害者等向け放送の状況について」に基づき説明。 (4)−2 議題(2)利用者の立場からの要望 資料5に基づき、新谷構成員(全日本難聴者・中途失聴者団体連合会)から説明。 情報アクセシビリティに関しては、本年5月に、障害者情報アクセシビリティ・コミュニケーション施策推進法が成立した。 8月には、障害者権利条約履行に関する日本政府報告に対して、国連障害者権利委員会の審査が行われ、その審査結果が公表されている。 その中では、第9条「アクセシビリティ」において、「障害者団体と密接に協議しながら、 政府は全てのレベルにわたってアクセシビリティを調和させ、ユニバーサルデザイン基準を定着させ、特に建物、交通、情報通信、 その他の施設やサービスが市民に開放または提供されるように、行動計画及びアクセシビリティ戦略を実施すること」が勧告されている。 このような状況を踏まえて、今回の研究会においては、今までの取組に加えて、 新たな法律の制定や情報アクセシビリティ分野への国際的な評価を踏まえた議論を行うことが非常に重要ではないかと考える。 今回の研究会で議論していただきたい点を3点提案する。 1点目は、総放送時間に占める字幕番組の割合と字幕付与可能番組における字幕番組の割合の数字が乖離していること。 「放送分野における情報アクセシビリティに関する指針」においては、「技術的に字幕を付すことができない放送番組」、 「外国語の番組」、「大部分が器楽演奏の音楽番組」及び「権利処理上の理由等により字幕を付すことができない放送番組」が 字幕付与の対象外とされている。総放送時間のうち字幕がついていないものはこれらの除外規定のどれに該当しているのか、 具体的な調査はできていないが、NHK総合を見る限りでは、字幕のつかない国会中継や記者会見、 日曜討論等の時間の割合が大部分を占めているのではないかという印象を持っている。 国会中継に関して、衆・参本会議での生字幕付与については、議事原稿が準備されるため、字幕訂正の可能性がほとんどないという理由から、 2018年から字幕がついている。一方、衆・参両院の委員会審議での生字幕付与の制限に関しては、 事前の原稿がなく、正確な字幕付与が困難という説明を頂いていたが、先日の臨時国会の予算委員会審議では、生字幕が付与されていた。 国会中継や記者会見等は画像による情報が少なく、ほとんどが音声による情報となっており、字幕が果たす役割が大変大きなものとなっている。 改めて、今回の研究会において、字幕付与を除外する番組の基準について議論していただきたい。 2点目は、字幕表示の改善。現在のテレビ画面は、画像情報、キャプション情報が非常に増えてきていて、 それら画像情報と字幕情報が重なり合う事例が頻繁に見られる。その結果、字幕情報は不十分になるにとどまらず、 画像情報そのものも十分に得られない例が増えている。以前、字幕表示領域は受信機に依存していて送出側では難しいということを聞いていたが、 送出側で字幕表示領域を独立させることは技術的に困難なものなのか。海外の報道番組等では、画面の下部に独立領域が準備され、 そこに字幕が流れている例をよく見かける。また、生字幕においては、同時性の確保が大きな問題。NHKの「ぴったり字幕」等の取組を評価する一方、 音声を完全に文字に変換した場合は、文字数が非常に多くなり、視聴者が読み切れない字幕となり、同時性を損なう場合もある。 言葉のケバや冗長な言い回しを簡潔にする、 また、話された内容を一定程度に要約する等によって同時性を確保するといった試みもあってよいのではないか。 放送事業者間で字幕の切替えタイミング、1画面の行数、1行当たりの字数等の共通したガイドラインをお持ちになっているか、 視聴者を交えたガイドラインの見直しは実施されているのかについてお伺いしたい。 3点目は、インターネット動画の配信についての字幕付与の問題。 インターネットを利用した動画配信が急速に普及している。Netflix(ネットフリックス)等は全番組に字幕をつけることを徹底している印象があるが、 動画配信における字幕付与は各事業者の自己判断ということか。それとも、公的な指針、ガイドライン等の策定の動きが現在見られているのか。 資料6に基づき、原田構成員(日本障害者リハビリテーション協会)から説明。 まず、指針全般に関して提言すべきことを申し上げたい。内外の最新動向への対応について、 この5月に議員立法による障害者情報アクセシビリティ・コミュニケーション施策推進法が全会一致で成立している。 現在、指針の前文には障害者権利条約、障害者基本法、障害者差別解消法等への言及があるが、 これに加えて、やはりこの重要な法律についても言及してはどうか。先程、新谷構成員からもお話があったが、 8月に障害者権利条約の初めての日本の審査があり、その総括所見の肯定的な側面としてこの法律の成立が明記されたこともある。 2番目に、災害時には情報の確保が生命・安全に直結する。現在、指針の字幕放送の部分には、大規模災害が発生した場合は、 できるだけ速やかに対応するという文言があるが、これを解説放送、手話放送についても同様に記載すべきではないか。 3番目に、地域格差の解消という課題がある。指針の実施状況を見ていても、全国ネットと地域での取組には格差があるのが現状。 地域の一番密着した情報にアクセスできないということもある。例えば県域局について、段階的な目標値を設定できないか。 なお、地域格差については、先程申し上げた障害者権利条約の総括所見でも言及されており、 また、現在内閣府で準備している第5次障害者基本計画案でも、放送におけるアクセシビリティの地域格差が言及されている。 4番目に、手話放送の強化をしていただきたい。具体的には、手話放送の目標値を総放送時間に対するパーセンテージで設定できないか。 難しい課題があることは理解しているが、諸外国では手話放送が積極的に行われているように見受けられ、 パーセンテージによる目標設定がされている国もある。特に緊急災害時においては、重点的に実施していただきたい。 また、今後の研究課題だが、字幕にはクローズドのオン・オフの機能があるが、手話でもオン・オフができるように、技術開発も進めていただきたい。 各目標に関して、様々な課題が話し合いの中で挙げられている。例えば、字幕放送では、地域格差について先程触れたが、 対象となる放送時間の拡大、時間帯別の目標値の設定、国会中継、政見放送等への字幕付与という課題も挙げられている。 解説放送については、令和3年度の実績では目標を達成しているところもあるため、今後、後半5年の目標はどうするのかという課題がある。 また、ニュース速報や内容のテロップ等、文字のみで表示される情報をどう読み上げるか。コロナ禍で解説放送が伸び悩んだことがあったようだが、 そうした災害時等における体制の維持の課題もある。 その他研究すべき課題について、字幕、解説、手話のより分かりやすい表示や質の問題が挙げられる。 また、インターネットにおける情報のアクセシビリティについて、 インターネットは放送よりもより自由に技術が使えるのではないかという期待もある一方で、 放送法の及ばない中、どのようにガイドラインを確保していけるのかという課題もある。 今後の様々な技術開発について、また政見放送、国会中継、CM等のアクセシビリティの向上といった課題もあるかと思う。 次に、今後の指針の実施に向けて、是非挙げておきたい論点を幾つか申し上げる。 まず、この指針は放送分野における情報アクセシビリティ指針であるため、 対象は狭い意味での視聴覚障害者に限定されないという視点が重要かと思う。 例えば、盲ろう者は単に見えない、聞こえないという重複障害というだけではなく、 独自の特性を持った障害だと見なされており、そのために必要な情報保障の方法がある。 また、知的障害者、発達障害者といった方々に分かりやすい内容をどう伝えるか。 絵の活用、見やすさ、聞きやすさの問題や、警報音に驚いてしまう方がいることも研究対象になるのではないか。 また、これは障害のない人たち、外国人やこども等にとっても役に立つものではないかと思う。 2つ目は、当事者参加は国際的な潮流にもなっているが、 各種技術や規格の開発において障害者が参加することはできないか。 要望、陳情するということだけではなく、一緒に取り組めるものがあるのではないか。 規格開発や様々な審議会や検討会への参加等も論点として挙げさせていただきたいと思う。 資料7に基づき、堀米構成員(全日本ろうあ連盟)から説明。 まず、平成30年に指針が策定されてからの5年間で、手話言語に対する社会的認知が大きく変わってきた。 全体の約20%の自治体で、手話言語条例が策定された。また、昨年のオリンピック・パラリンピックの開会式・閉会式でも、 手話通訳の存在・認識が広まった。また、今年の5月には障害者情報アクセシビリティ・コミュニケーション推進法が成立した。 私たち聞こえない者にとって、手話放送は非常に重要なものであり、その中で要望したい意見を申し上げる。 手話放送に関して、これまで1週間に15分という数値目標があったが、先程原田構成員からも話があったとおり、 パーセンテージでの設定をお願いしたい。イギリスや韓国等ではパーセンテージの設定があり、その目標は5%となっている。 実績では約6%となっており、目標値を超えていると聞いている。字幕放送があれば、聞こえない人でも、聞こえにくい方でも、 全ての情報アクセスが100%保障できるという考え方ではなく、手話言語を必要としている人がたくさんいることをより強く意識していただきたい。 SDGs(エス・ディー・ジーズ)の考え方にもあるように、手話言語を必要とする人たちを含めて誰ひとり取り残さないという考え方を持って進めていただきたい。 手話放送の目標値を単に公表するだけではなく、 そこに向けて達成するための予算確保や技術開発等も我々とともに一緒に進めていただければと思っている。 また、クローズド手話言語(手話のオン・オフの機能)をテレビ受信機メーカーと共に検討を進めていける場を作っていただきたい。 先程、令和3年度の手話放送の実績が出ていたが、手話放送がゼロの放送局が10ある。この10の放送局にやはりサポートが必要だと考える。 国として働きかけていただくことが大切だと思う。このゼロの放送局では、「目で聴くテレビ」を購入していただいて、 その地域で放送するという方法もあるかと思う。 次に、字幕放送に関して、人口の多い関東圏や近畿圏と地方では非常に格差があり、 目標値を大きく下回っている地域がある。そこでは費用面・人材面等の様々な課題があると思う。 高い目標を設定するのではなく、段階的な目標値を設定する方が、その目標に向かって進んでいくという気持ちが起きやすく、 そういった環境整備が必要だと考える。 また、字幕放送について、現在は6時から25時までの目標が設定されているが、深夜1時から6時までの字幕放送の目標も必要ではないか。 深夜番組を見る人たちも多いので、その人たちも含めて目標を設定していただきたい。 最後になるが、災害発生時には、地域の住民の人たちの命を守るという観点から、災害時緊急放送の目標値設定は難しいと思うが、 これまでの実績時間数から割合を出せるのではないかと思う。 資料8に基づき、三宅構成員(日本視覚障害者団体連合)から説明。 放送事業者に対しては、私たちの情報保障のために取り組んでいることに敬意を表するが、 見えない・見えにくい人もテレビを見ているという観点から、今後も取組をお願いしたい。 解説放送は、再放送だけでなくオンタイムの放送でも必ず付けていただいている等、取り組む事業者が増えていることに関しても感謝申し上げる。 今後もこれが継続できるよう、一層取り組んでいただければ、非常にありがたい。 ニュース速報のうち、生番組、特にニュース・情報番組の中で速報が流れたときには、全ての放送局ではないが、 アナウンサーに速報について簡単に触れていただくという工夫がされている。ニュース速報の音声化については長年要望している内容であるため、 今後ともこのような取組を是非お願いしたい。 ニュース・情報番組等では、外国人のインタビュー等において、字幕テロップの同時吹き替えが一部行われている。 最近では、よく聞かれる外国語だけではない言葉が様々なインタビュー等で流れてくるので、字幕だけに留まらず、 音声でも引き続き情報が受け取れるような取組をお願いする。 また、県域局の事業者に関しても、買い取った番組に解説放送が付与されているものに関しては、 それを放送することをこの5年間で取り組まれて、実現している。今後も継続、あるいは増やしていただきたい。 ここからが意見となる。毎年開催されている全国視覚障害者福祉大会で全国47都道府県・政令市の視覚障害者団体を中心に意見を集約して、 陳情という形でまとめているが、今回提出した資料は、そのうち放送に関するものだけを抜き出している。 平成30年から令和4年までの陳情を記載しているが、毎年、内容がほぼ同じものが上がっている。解説放送の充実、 ニュース速報の内容の音声化、外国人のインタビューを中心とした同時吹き替え等の情報保障をすること、 さらには弱視、ロービジョンの方に関する内容も含まれている。このようなものが、毎年全国の声として我々の団体に集められ、 集約されていることをご認識いただきたい。なお、この内容は毎年、総務省やNHK、民放連に届けている。 解説放送は、数値としては目標を達成しているところも確かにあるが、決して高い数字ではないため、必ず解説放送の付与をお願いしたい。 ニュース速報に関しては、チャイム音のみでその内容が把握できないと、ほぼ同時の情報保障という観点からは格差が出ている。 技術面で解消できることがあるのなら、ニュース・情報番組だけではなく、 視覚障害者がニュース速報の内容を同時に受け取れるようにするための取組もお願いしたい。 外国人のインタビュー等のテロップの読み上げ、あるいは同時吹き替えに関して、情報保障の観点から、 なるべく同時に情報を受け取れる仕組みを今後も継続していただきたい。 また、オンライン等でのインタビューで音声が不明瞭な場合や、事情により変声されているもので、 字幕テロップが表示されているものに関しては、日本語の同時吹き替え等の取組をお願いしたい。 次に、弱視、ロービジョンに関する対応について、視覚障害者の約8割は、 弱視、ロービジョンという見えにくいことで生活に困り事がある方が占めている。 そういった方たちは解説放送も利用するが、字幕放送も利用するので、字幕に表示されている文字が読み取れるように、 弱視、ロービジョンに対する配慮をお願いしたい。 最後に、障害者情報アクセシビリティ・コミュニケーション施策推進法が施行されている。 その中で今回、総務省の資料の中では第10条、第11条のことが触れられているが、 同法の第13条にも、具体的に放送分野のことが条文として示されている。 各放送事業者による解説放送その他視覚障害者向けの情報保障の取組に関しては、国、地方公共団体が率先して後押しするような支援をお願いしたい。 資料4に基づき、岩下構成員から説明。 三宅構成員からも音声解説の話があったが、2点提案したい。 1つは、AIによる自動音声活用システムについて。ニュース中の外国語のコメントが分かりにくいという話があったが、 AIを使ってリアルタイムで字幕を音声化できないだろうかという提案。視覚障害者はスクリーンリーダーの機械音声に慣れているため、 最近ニュースの読み上げに利用されるAIの音声は必ずしも聞きにくいわけではない。むしろ、AIの場合は噛むことが絶対にない。 AIを活用して、表示されている字幕を音声化し、リアルタイムに出すことが技術的には可能だと思うため、要望したい。 もう1つは、私が理事を務めるNPO法人メディアアクセスサポートセンターでは、字幕・音声ガイドを制作している。 映画館にスマホを持ち込んでアプリを利用し、字幕・音声ガイドを利用することができる。 眼鏡のつるの部分にスピーカーが付いているスピーカーグラスを利用することで、外には音を出さず、 映画館に負担をかけることなく音声ガイドを聞くことができる。このようなセカンドスクリーン型情報保障を我々は提案しているが、 テレビ局側で音声ガイドを作らなくても、このアプリを使うことでコストをかけることなく情報提供ができるというメリットがある。 これを総務省の音声ガイドの付与率の中に含めていただけると、非常に我々としては音声ガイドを制作しやすい。是非ご検討いただきたい。 (10分間の休憩) (4)−3 議題(3)視聴覚障害者等向け放送を取り巻く情報通信技術動向 資料9に基づき、NHK(放送技術研究所・メディア開発企画センター)から説明。 この秋から始めている3つの実証実験について説明する。1点目は自動生字幕放送トライアルについて、 2点目は天気・防災手話CG試験提供について、3点目はスポーツ中継での解説音声制作・配信について。 1点目の自動生字幕放送トライアルについて。地域放送局では、 字幕を制作・送出する設備整備や専門技能を有したオペレーター確保が課題となっている。 そこで、AI音声認識装置を活用した自動生字幕放送によって、地域放送局の字幕サービス拡充を図りたいと考えている。 今回のトライアルは、大阪放送局で実施する。実施期間は10月31日から11月25日まで、土日・祝日を除く平日の4週間。放送時間は1日2回、 午後0時15分から0時20分放送のニュースと、午後3時7分から3時10分のニュース。放送エリアは近畿ブロックで、 大阪、京都、兵庫、滋賀、奈良、和歌山でご利用いただける。 今回のトライアルでは、音声認識装置で変換した字幕をそのまま放送し、オペレーターによる修正は行わない。 より正確な字幕をお伝えするために、変換精度が高いアナウンサーの読み上げのみ字幕を付与する。 インタビュー等のフリートークでは変換精度が低下する傾向にあるため、字幕を付与せず、テロップの内容をオープンキャプションとして伝える。 また、音声認識装置の学習データを過去2年分から過去10年分に増強し、変換精度を向上している。 また、全日本ろうあ連盟や全日本難聴者・中途失聴者団体連合会等多くの団体の皆様にご協力をいただき、利用意向調査を実施する予定。 では、自動生字幕放送のサンプル動画をご覧いただく。 (動画視聴) アナウンサーの読み上げが正確に字幕に変換されていたことが確認できたかと思う。固有名詞については、事前に音声認識装置に学習させることで、 正確に変換することが可能。今後も、音声認識の制度向上を図りながら、地域の字幕サービス向上に努めたい。 続いて、2点目の天気・防災手話CGについて説明する。このサービスは、大雨特別警報や津波警報等、 気象庁から発表されたデータを基に手話CGを自動生成し、24時間365日、災害時にいち早く避難警戒を呼びかける取組。 10月3日からインターネットサイト「天気・防災手話CG」で試験提供をスタートした。 10月14日に東京都に土砂災害警戒情報が発表された際には、手話CGで避難や警戒を呼びかけた。手話CGによるサンプル動画を用意した。 (動画視聴) このように、どこに、どのような警報が出ているのか、 どのようなことに警戒すべきかを1分から2分程度で繰り返しお伝えすることにしている。 この天気・防災手話CGは、NHKのホームページ「NHKオンライン」や「ニュース・防災アプリ」からアクセスできる。 平時は全国の気象情報を配信し、災害時は防災情報を手話CGで配信している。天気・防災手話CGについても、 全日本ろうあ連盟や全難聴のご協力をいただき、利用意向調査を実施する予定。 3点目のスポーツ中継での解説音声制作・配信について。解説放送のほとんどは収録番組であり、 生放送番組には解説音声が付与されていないのが現状。特にスポーツ中継での感動を障害の有無によらず共有したいという声をいただいている。 そこで、NHK放送技術研究所では、 スポーツ中継の試合状況を解説する音声を利用者のスマホにリアルタイム配信する解説音声制作・配信システムを開発している。 例えば、野球中継でテレビ画面に表示されている得点やボールカウント、ピッチャーが構えた等の選手動作に関する情報は画面から視覚的に伝わるため、 アナウンサーが話すことはほとんどない。そこで、このシステムは、 アナウンサーがあえて話さないテレビ画面から得られる視覚的な情報を利用者のスマホに配信し、解説音声として提供する。 具体的には、まず、放送局側で手動もしくは自動で「ピッチャー構えた」等の解説テキストを制作する。 画面に表示されている球速やボールカウント等は、文字認識により自動的に解説テキストに変換する。 制作した解説テキストに対してクラウドサーバーで音声合成処理を施し、配信サーバーから音声データとして利用者のスマホに配信する。 ご家庭では、テレビの音声と併せて、スマホからの解説音声をお聞きいただける。 このシステムの有効性を評価するため、今年のプロ野球日本シリーズで10月23日から29日までNHKで放送した試合について、 解説音声の配信実験を行った。視覚障害者を含む36名にご参加いただき、テレビの野球中継と併せて、スマホからの解説音声をお聞きいただいた。 現在、参加者からのアンケート結果を分析しているが、解説音声に求められる情報を精査し、解説テキスト制作のさらなる自動化を進める予定。 また、実サービス開始に向けて、アプリの機能やサーバーの配信機能を強化していきたいと考えている。 資料10に基づき、ヤマハ株式会社から説明。 2017年の「視聴覚障害者等向け放送に関する研究会」を受けて、さらなる字幕普及に向けた取組として、自動字幕システムの検証に着手した。 これはテレビ局に音声を文字化するための機器を置き、アナウンサーの音声等を文字化して、 視聴者に対してインターネット経由でスマートフォンに字幕を表示したり、 ハイブリッドキャスト等を通じてテレビ画面に字幕を表示したりするためのシステム。 2018年から、総務省補助事業として、自動字幕システムの開発と放送局との共同実験を開始した。 2019年、2020年と合計3年にわたり、地上放送課、NICT、放送局、聴覚障害者団体と共に実証を実施してきた。 この検証では、音声認識精度は、短いストレートニュースに対して、2018年の時点では約85%の精度だったのに対し、 2020年終了時点では約92%まで向上した。最大で98%の精度が出た番組もあった。 これは、2019年度から実施しているNICTによる音声認識向上のための放送音声に特化したエンジン学習の成果による効果が大きいものと考えられる。 その他、ストレートニュース以外の番組については音声認識の難易度が上がり、情報番組では約86%、教養番組では約81%、 娯楽番組では約66%の精度という結果だった。 また、字幕が表示される速度について、ヤマハの調べでは、通常、生放送時に人力によって付与された字幕は、 約5.6秒遅れて出てくることが分かっているが、自動字幕では平均1.8秒と人力による字幕よりも早く表示されるという結果も得られている。 字幕を表示する機器について、初年度は主にスマートフォンを使ったセカンドスクリーンでの表示、 2年目以降はハイブリッドキャストやセットトップボックスを用いて、 テレビ画面の中にテレビ映像と並べて字幕が表示されるアウトスクリーン型の表示についての実証を行った。 これらについて、多くの聴覚障害者団体にご協力いただき、使用感調査を行った。 セカンドスクリーンは、2つの画面を見分ける必要があるため少し見づらいというご意見を多く頂いた。 一方、一度字幕が流れてしまっても、スマホを操作することで読み返すことができるという利点があるという調査結果が得られている。 また、ハイブリッドキャストやセットトップボックス、アウトスクリーン型字幕では、通常のクローズドキャプション字幕に近い表示ができることから、 見やすさという点で好評だったが、専用のテレビや機器が必要となる点が課題と感じる方が多かった。 自動字幕の技術的な課題とそのアプローチについて紹介する。大きな課題として、複数の人が話をする番組において、 誰が何を話しているのかが字幕では分かりづらいことが挙げられる。解決するためには、話者ごとにマイクを分けて、 それぞれ別々に音声認識をする必要があるが、そうすると今度は、マイクに複数の人の声が被ってしまい、 正しく音声認識されなくなるという問題が発生した。そこで、音源分離処理というマイクの音声被りを解消する技術の検証を行った。 2020年の調査委託事業においては、娯楽番組を対象に、2人の掛け合いが行われている部分にその技術を適用したところ、 約4%の認識精度の改善が得られた。この技術については現在も研究を進めており、昨年度末までの成果として、 2人で発話したシーンにおいて、マイク音声被りに対して約10%改善するというところまで効果が出てきている。 現在は、2人以上の音声についての分離効果について研究を続けており、実用化を目指して日々研究に取り組んでいる。 もう一つの大きな課題として、固有名詞の音声認識精度の改善が挙げられる。我々は対策として原稿や単語を事前に登録する仕組みを開発した。 事前に辞書のデータを用意して登録することで、特定の単語を認識しやすくするものだが、新しい単語を登録することで、 元々正しく認識できていた単語が認識しづらくなるという副作用が発生してしまうことがある。 従来の音声認識精度が辞書登録データに大きく左右されない、いわゆる「副作用が起きにくい設定」で辞書データを登録し、 娯楽番組を対象に実験したところ、認識精度の改善は約2.3%であまり大きくなかった。 次に、副作用が起こる可能性があるが、「辞書データが結果に出やすい設定」で、各単語に対して精度の調整を綿密に行った上で、 スポーツ実況を対象に実験したところ、42%から77%の認識精度改善が見られた。辞書には選手の名前が多数登録されていたが、 名前がかなり認識されるようになった。 これらの実験により、固有名詞の認識精度の向上については、現状では綿密な設定が必要であり、 忙しい放送業務の中でもスムーズに対応していけるような、これらの設定の間を取るような仕組みの開発が今後必要になってくると考えている。 今後、自動字幕をさらに放送に適用していくに当たっては、次のような課題があると考えている。 総務省が発表した資料を基にヤマハで計算した数字だが、キー局等の規模の大きな放送局については、 字幕付与率はかなり高い水準となってきているが、地方局等の規模の小さな放送局については、まだ字幕付与の達成率に課題があると思う。 地方局が簡単に、人的コストをほとんどかけることなく字幕を付与できるようになることが重要なポイントだと考えている。 また、視聴者が簡単に字幕を見ることができるようになるためには、 データ放送や普段視聴されるクローズドキャプションへの自動字幕の適用が必要だと考えているが、 自動字幕の認識率は100%ではないため、ある程度の修正作業が必要なのが現状。 ヤマハが独自に放送局20局に対して実施したヒアリング調査によると、自動字幕システムの導入に向けての課題は、 放送の電波を通じて字幕を配信するに当たって、自動字幕が誤っていた場合に訂正放送の対象になるかどうかがまだはっきりとしておらず、 現状は修正作業が必要だという認識でいること。その上で、その字幕修正や字幕の監視等に人的コストがかかることから、 自動字幕システムの運用コストを大きくかけるのが難しい点が最も大きな課題だと考えている。 現状は、間違った字幕は放送しないというスタンスの下、この自動字幕の技術は、字幕起こしの補助としていくつかの放送局で使用され始めている。 最終的には人手による修正が行われていると見受けられる。また、放送以外、例えばイベント等では、 自動字幕なので間違う可能性があるという告知をした上で、使われ始めているところもある。 今後、自動字幕を活用していくためには、データ放送やクローズドキャプションに自動字幕を使用した場合に 誤りが発生した場合の取決め等が必要になると考えられる。訂正放送の対象となるかどうか、 必要とされる認識精度等をしっかりと議論していく必要があると考える。今後、精度向上や複数人の会話を識別可能な技術の向上に加えて、 こういった内容について活発な議論が行われると、自動字幕の放送への適用可能性がより高まっていくと思う。 (5)意見交換 原田構成員 自動字幕で訂正放送をしたことはあるのか、訂正放送の対象になったことはあるのかを伺いたい。 ヤマハ 森口氏 これまで実証実験として放送局と共にセカンドスクリーン、ハイブリッドキャスト等によって自動字幕を付与しているが、 その中で訂正放送の対象になったものはなかったと認識している。実証実験のため、事前に「自動字幕のため間違える可能性がある」 と注意を入れていたため、対象にならなかったのではないか。 音座長 総務省から補足意見はあるか。 事務局 可能な範囲で調べたいが、あまり事例はないのではないかと思われる。 近藤構成員 ネットで調べた限りでは半分程度のテレビがハイブリッドキャストに対応しているとのことだが、 NHKでハイブリッドキャストについて進めている研究があれば教えてほしい。 NHK 花輪氏 ハイブリッドキャストについては引き続き放送技術研究所で研究を進めている。 ただ、ユニバーサルサービスに関してはハイブリッドキャストとは違う形で研究を進め、実証実験をしている。 近藤構成員 現在、ブロードバンドスクール協会において、デバイスとサービスに関するアンケートを実施している。 字幕や放送に関するご意見も頂いて、本研究会で報告させていただく。 三宅構成員 NHKが実施した日本シリーズにおける解説放送の実証実験について、 既に見えている課題やしっかり取り組むことができたこととして、現段階で示せるものがあれば教えてほしい。 NHK 高橋氏 NHKが放送した日本シリーズの中継で、解説音声のスマホ配信の実験を行った。 今回の実験に参加した視覚障害者のうち、約7割の方から非常に効果的で今後も使いたいというご意見を頂いた。 課題としては、視聴者によって取得したい情報が異なること。今後、利用者側で取得したい情報を選択できる機能を付与することが考えられる。 また、今回は手動操作で情報提供をしていたが、実サービスの運営を行う上では自動化を進める必要があると考えている。 世木構成員 各団体からの要望として、ニュース速報の内容が視覚障害者の方には分からないという意見が多く出ているが、 ニュース速報の読み上げが実現できていないことには何か技術的な問題があるのか。放送事業者に伺いたいが、 例えばBML(Broadcast Markup Language)を使って追加ES(Elementary Stream)を作成し、 音声チャンネルを切り替えて出力することは可能だと思う。また、BMLの音声ファイルを送る機能を用いて、 合成音声を送付することも可能だと思う。受信機を改良する必要はあるかもしれないが、 場合によってはスーパーとして表示されるテキスト情報さえ外部に出せば、そのテキスト情報を読み上げることは可能ではないか。 次回の研究会で放送事業者側から要望に対する対応のご報告があると思うので、そのときにご報告いただけるとありがたい。 小原構成員 ニュース速報の音声化については、これまでも様々な形でご要望を頂いていたが、技術的な制約が多い。 ニュース速報が出たときに音声を上乗せすることは、ラジオであればできるが、テレビではできない。 世木構成員 私がNHK放送技術研究所に在席していたときには、ニュース速報が含まれている音声を別のESに作成し、 BMLの操作による切替えを検討していたことがあり、ニュース速報を読み上げることは実際には可能ではないか。 また、音声ファイル自体をBMLで送信することも可能と思われるが、その点についてはいかがか。 小原構成員 現状では回答したとおりの状況と聞いていたため、もう少し聞き取りを行った上で回答したい。 代替措置というわけではないが、スマートフォンのNHKニュース・防災アプリのプッシュ通知で受け取ったニュース速報を読み上げることは可能。 また、特に緊急地震速報等の命に関わるような速報については、通常の番組が放送されていても、可及的速やかにニュースセンターで割り込み、 緊急ニュースを立ち上げる取組を行っている。 世木構成員 要するに、緊急性があるものについては対応するということかと思う。 一方、生命の危険がない速報もスーパーで出していると思うが、視覚障害者がその情報を受けられないことは、 今年制定された障害者情報アクセシビリティ・コミュニケーション施策推進法の趣旨に反しているのではないか。 他の皆様も含めてご検討いただけるとありがたい。 新谷構成員 ヤマハの発表について、話者ごとに独自の音声認識ツールを使うことには非常に興味がある。 話者を個別に捉えられたとしても、画面表示の際には時間軸の問題があるのではないか。 同時に掛け合いで話している場合は、音声認識ツールだけ個別に用意して、表示される画面がどうなるのか気になる。 ヤマハ 森口氏 新谷構成員のご指摘のとおり、時系列の処理が一番難しい。時系列をなるべく崩さないよう、 話者の字幕にラベルを付し、色分けや吹き出し等によってきれいに見せながら、 別々の話者が話していることが分かりやすくなるような順番に並べて画面に表示している。 (6)その他 事務局から、追加意見については、令和4年11月8日(火曜日)までにメール等で事務局まで提出してほしい旨の連絡があった。 事務局から、次回会合については調整の上別途連絡する旨連絡があった。 (7)閉会 以上