今週のテーマ:技術開発
OpenAIが音声認識に関する新たなアプローチを提唱した論文「Robust Speech Recognition via Large-Scale Weak Supervision」で紹介された、教師あり学習と教師なし学習の中間に位置する「弱教師あり学習」という新たな手法について紹介します。研究では、インターネット上の多言語・多タスクデータセットを用いて、全体で68万時間にも及ぶ大規模な学習を行いました。その結果は、従来の教師あり学習に匹敵するもので、新たな可能性を提示しています。これにはどのような技術が使われ、どのような成果が得られたのか、紹介していきます。
音声認識技術は、バーチャルアシスタントやテープ起こしサービス、言語学習、障がい者のアクセシビリティなどの分野で活用されていますが、自然言語の多様性と複雑性が課題となっています。従来の音声認識モデルは、大量のラベル付きデータが必要な「教師あり学習」に依存していました。
そのような中発表されたOpenAIの論文「Robust Speech Recognition via Large-Scale Weak Supervision」について紹介します。この論文を発表したOpenAIの研究者らは、弱教師あり学習(weakly supervised learning)を用いた音声処理システムの能力を調査しています。これはインターネット上に存在する680,000時間に及ぶ多言語・多タスクのデータセットを使用 …続きを読む |