脳卒中患者によく見られる失語症は、話す能力に深刻な影響を与えます。この記事では、大規模音声認識モデルを使用して、失語症患者の適切な休止を検出する方法が提案されています。自動音声認識(ASR)モデルを使用して、音声からテキストに変換し、休止タグ付きのテキストとして扱うことで、不適切な休止位置をラベリングしました。また、不適切な休止予測層を持つASRモデルも拡張されました。実験では、提案手法が従来手法よりも失語症患者の不適切な休止をより良く検出することが示されました。
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by Jeehyun Lee,... kl. arxiv.org 03-01-2024
https://arxiv.org/pdf/2402.18923.pdfDybere Forespørgsler