自動音声認識(ASR)は研究の焦点となっており、本研究では深層学習モデルを活用して文脈的な認識を向上させる新しい手法が提案されています。GMM-HMMとDNNモデルを統合し、トランスフォーマーモデルを使用して単語ラティスを適切に再採点することで、卓越した能力が実証されました。この研究はLibriSpeechデータセットで効果的性能を示しました。
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Ankitha Suda... lúc arxiv.org 03-05-2024
https://arxiv.org/pdf/2310.09680.pdfYêu cầu sâu hơn