核心概念
医療音声の分類において、DRSCモデルはテキストとメルスペクトログラムから意図情報を自動的に学習し、25種類の異なる医療症状を95%の平均精度で検出することが示されました。
摘要
この論文では、医学的な音声診断システムにおいて、DRSCモデルが意図情報を効果的に抽出し、異なるドメインからの情報を統合して正確な診断を行う方法が提案されています。早期の深層学習手法は患者の音声特徴を無視してきましたが、DRSCはテキストと音響特徴から意図情報を抽出し、その結果25種類の医学的な症状を高い精度で検出します。さらに、実験結果はDRSCが他の手法よりも優れた性能を持ち、不正確な転記でも堅牢性を示すことが示されています。
統計資料
テキストとメルスペクトログラムから25種類の医学的な症状を95%の平均精度で検出。
引述
"Our proposed model achieves competitive performance in terms of accuracy and robustness on the Medical Speech, Transcription, Intent dataset."
"Experimental results show that DRSC achieves satisfactory performance, and the experiments on inaccurate transcriptions show that our model owns robustness."