自動音声認識(ASR)は研究の焦点となっており、本研究では深層学習モデルを活用して文脈的な認識を向上させる新しい手法が提案されています。GMM-HMMとDNNモデルを統合し、トランスフォーマーモデルを使用して単語ラティスを適切に再採点することで、卓越した能力が実証されました。この研究はLibriSpeechデータセットで効果的性能を示しました。
เป็นภาษาอื่น
จากเนื้อหาต้นฉบับ
arxiv.org
ข้อมูลเชิงลึกที่สำคัญจาก
by Ankitha Suda... ที่ arxiv.org 03-05-2024
https://arxiv.org/pdf/2310.09680.pdfสอบถามเพิ่มเติม