YouTube、毎日ビデオ10億本を自動字幕化と発表
YouTube、毎日ビデオ10億本を自動字幕化と発表
Googleによれば、このサービスはエラー率で人間による文字起こしに日々近づきつつある。この数年の同社のエンジニアリング・チームの努力により、字幕の正確性は50%増加した。YouTubeビデオの内容はとほうもなく広い範囲にわたるので字幕を付けるのは困難な作業だ。同時にGoogleの音声認識テクノロジーにとって非常に有用な訓練データを提供する役割も果たしている。YouTubeのユーザー・コミュニティーは字幕をチェックし、間違いがあればフィードバックする。この情報も機械学習の精度をアップするのに非常に役立っている。
キャプションの制度を高めるため、音声認識、機械学習アルゴリズムの改善、トレーニングデータの拡大を目指したという。この技術的努力は、英語による自動キャプションの精度を50%向上させ、エラー率は人間による文字起こしに近づきつつあるとのこと。
YouTubeブログ原文記事はこちら