本論文では、コードスイッチング(CS)シナリオにおける自動音声認識(ASR)の課題に取り組むため、音声条件付き大規模言語モデル(SC-LLM)と専門家混合(MoE)アーキテクチャを組み合わせた手法を提案している。
具体的には以下の3つの主要な貢献がある:
実験結果では、提案手法が既存の最先端モデルと比べて10%以上の相対的な精度向上を達成し、SC-LLMの潜在的な可能性を示した。
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Fengrun Zhan... alle arxiv.org 09-25-2024
https://arxiv.org/pdf/2409.15905.pdfDomande più approfondite