報道資料
平成29年9月8日
総務省
国立研究開発法人情報通信研究機構
『翻訳バンク』の運用開始
―自動翻訳システムのさらなる高精度化に向けて、様々な分野の翻訳データを集積―
総務省と国立研究開発法人情報通信研究機構(NICT、理事長: 徳田 英幸)は、自動翻訳システムの様々な分野への対応や高精度化を進めるため、オール・ジャパン体制で翻訳データを集積する『翻訳バンク』の運用を開始します。これにより、社会・経済活動のグローバル化が進む中で我が国の国際競争力の強化に貢献します。 【ポイント】
■ オール・ジャパンで様々な分野の翻訳データを集積する『翻訳バンク』の運用を開始
■ ニューラル機械翻訳での活用等に向けて翻訳データを集積し、多分野対応や高精度化を実現
■ 翻訳データを提供して頂く方にもメリットのある仕組みを導入
1 背景・課題
総務省とNICTは、世界の「言葉の壁」をなくすことを目指すグローバルコミュニケーション計画
*1を推進しており、その一環としてNICTは音声翻訳(“VoiceTra
*2”と呼ぶ)とテキスト翻訳(“TexTra
*3”と呼ぶ)の研究・開発・社会実装を進めています。これまでNICTにおいては翻訳の高精度化に必要な翻訳データの集積(
表1)に取り組むとともに、2017年6月からニューラル機械翻訳技術
*4の導入等を進めておりますが、翻訳技術を活用する分野によっては翻訳データが足りないことが課題となっていました。
2 翻訳バンクの運用開始
そこで、総務省とNICTは、様々な分野における翻訳データの集積に向けて、NICTが様々な分野の翻訳データを集積して活用する『翻訳バンク』の運用を開始することにしました(
図1)。
『翻訳バンク』の開始にあたり、データを提供して頂く方のメリットを明確化するため、NICTの自動翻訳技術の使用ライセンス料の算定の際に、提供が見込まれる翻訳データを勘案して負担を軽減する仕組みを用意しました。
3 今後の展望
総務省とNICTは、様々な分野で高精度翻訳を実現することで「言葉の壁」をなくし、日本を『世界で最も多言語コミュニケーションが容易な国』にすることによって、日本の経済・社会の活性化に貢献します。
<用語解説>
<補足説明>
- 自動翻訳技術の性能向上のためには、NICTが研究開発において取り組んでいる翻訳アルゴリズムの改良に加え、翻訳データの質と量の確保が重要となっています。翻訳バンクでは翻訳データを集積して自動翻訳技術に活用することで、自動翻訳技術で対応できる分野を広げるとともに、さらなる高精度化を実現します。
- NICTの自動翻訳技術の使用ライセンス料の算定の際に、提供が見込まれる翻訳データを勘案して負担を軽減する仕組みを導入することで、翻訳バンクにおける好循環モデルを構築し、皆で自動翻訳技術を育てながら、高性能な自動翻訳技術を活用していくサイクルを確立します。
- 翻訳バンクの当面の目標として、100万文×100社=1億文の翻訳データの集積を目指します。
- 翻訳バンクWebサイト http://www2.nict.go.jp/ais/h-bank.html
- 現在29組織からデータ提供を受けています(2017年8月現在)。 http://voicetra.nict.go.jp/news/
ページトップへ戻る