自動音声認識(ASR)は研究の焦点となっており、本研究では深層学習モデルを活用して文脈的な認識を向上させる新しい手法が提案されています。GMM-HMMとDNNモデルを統合し、トランスフォーマーモデルを使用して単語ラティスを適切に再採点することで、卓越した能力が実証されました。この研究はLibriSpeechデータセットで効果的性能を示しました。
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Ankitha Suda... alle arxiv.org 03-05-2024
https://arxiv.org/pdf/2310.09680.pdfDomande più approfondite