Centrala begrepp
ASRシステム内での文脈認識を強化するための新しいアプローチを提案し、Transformerモデルを活用して卓越した能力を実現。
Sammanfattning
自動音声認識(ASR)は研究の焦点となっており、本研究では深層学習モデルを活用して文脈的な認識を向上させる新しい手法が提案されています。GMM-HMMとDNNモデルを統合し、トランスフォーマーモデルを使用して単語ラティスを適切に再採点することで、卓越した能力が実証されました。この研究はLibriSpeechデータセットで効果的性能を示しました。
Statistik
ASRシステム内での文脈的情報の改善により、Word Error Rate(WER)が1.36%低下。
テストセット 'test-clean' におけるLattice Type 1のWERは6.65%。
テストセット 'test-other' におけるLattice Type 1のWERは17.32%。
Citat
"ASRシステム内での文脈的情報の改善により、Word Error Rate(WER)が1.36%低下。"
"この研究はLibriSpeechデータセットで効果的性能を示しました。"