アドバンスト・メディア、日本テレビのリアルタイム字幕制作システムに同社の音声認識技術「AmiVoice」が採用されたことを発表

株式会社アドバンスト・メディアは同社の音声認識技術「AmiVoice」が日本テレビ放送網株式会社(以下、日本テレビ)のリアルタイム字幕制作システムに採用されたことを26日、発表しました。

昨今、静音が求められる環境下での視聴や聴覚障害者や高齢者などの視聴補助の観点からも、テレビ字幕のニーズが増加。
総務省では、できる限り多くの放送番組に字幕の付与充実を目指した行動指針を明確にしており、字幕作成は各放送局の大きな課題となっています。
発表によると、AmiVoiceを利用した字幕制作システムは、スポーツ中継の字幕作成に活用されているとのこと。また、字幕作成システムの構築はエル・エス・アイ ジャパン株式会社が行なっています。

AmiVoiceを利用した字幕制作システム

日本テレビ開発担当者のコメント
(以下、プレスリリースより引用)
「生放送番組にリアルタイムで字幕を付与するシステムでは、字幕を作成して送出するまでに要する時間をいかに短くするかがポイントとなります。弊社のような音声認識技術をベースとしたシステムでは、音声認識で生成したテキストを人の手で修正してから送出するため、入力音声に対する認識結果が正確であればあるほど修正の手間が減り、より早い送出に繋がります。新システムで採用する音声認識ソフトウェアの選定にあたっては、同じ条件で数種類の製品をテストしましたが、最も高い認識率を示したのがAmiVoiceでした。また、システムの設計上、入力した音声を分割して音声認識結果のテキストと結びつける処理が必要となるのですが、そのような要求にも柔軟に対応してAPIを用意して頂けたことも採用理由の一つです。」

アドバンスト・メディアの発表によると、日本テレビでは、2005年より独自のリアルタイム字幕制作システムを運用していたが、新たに機能を強化した新システムを開発するに際し、音声認識技術AmiVoiceが採用されたとのこと。
システムでは、スポーツ中継番組のオンエア音声を専門のアナウンサーが復唱することで、音声認識技術によりテキストを作成。テキストの修正や確認は人の手によって行われ、その後字幕として映像に付与されという。
野球・サッカーなど、競技ごとの専用辞書を作成しチューンナップされているようで、専門用語や選手名なども高い認識率を誇るとのこと。復唱する個々のアナウンサーの声を学習するため、使えば使うほど認識率が向上するとのこと。

関連情報リンク

株式会社アドバンスト・メディア

関連記事