この論文では、OpenAIによってリリースされたWhisper自動音声認識(ASR)モデルのコンテキスト学習能力に焦点を当てています。新しいスピーチベースのコンテキスト学習(SICL)アプローチが提案され、言語レベルの適応実験が行われました。中国方言を使用した結果、SICLを適用することで相対的な単語エラー率(WER)削減が実現されました。さらに、k最近傍法に基づくインコンテキスト例選択技術も適用され、効率性が向上しました。スピーカー適応や連続音声認識タスクでも相対的なWER削減が達成されました。定量的な分析も提供され、SICLのフォノロジー変異や方言固有のレキシカルニュアンスへの適応性に光を当てています。
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Siyin Wang,C... lúc arxiv.org 03-21-2024
https://arxiv.org/pdf/2309.07081.pdfYêu cầu sâu hơn