核心概念
臨床試験における多数の医療従事者、患者、データ収集環境を考慮すると、高品質なデータを収集することが大きな課題となる。本研究では、話者認証モデルを用いて、同一の臨床試験に複数回参加する患者を検出し排除することを提案する。
要約
本研究では、英語、ドイツ語、デンマーク語、スペイン語、アラビア語を話す認知症や精神疾患の患者を対象に、事前学習済みの話者認証モデルを評価した。
- 事前学習済みのTitaNet、ECAPA-TDNN、SpeakerNetモデルを使用し、欧州言語では2.7%以下、アラビア語では8.26%の等誤り率(EER)を達成した。これは、多様な言語や方言にわたって使用できる汎用的で効率的な話者認証システムの開発に大きな一歩となる。
- 異なる言語間での性能差は、言語の類似性や学習データの偏りなどが影響していると考えられる。特に、アラビア語では他の言語に比べ性能が低下した。
- 異なる言語や認知症・精神疾患の種類、データ収集方法などが話者認証性能に影響を与える可能性が示唆された。
統計
英語の患者データでは、絵画説明課題の等誤り率が3.10%と最も低かった。
アラビア語の患者データでは、等誤り率が8.26%と他の言語に比べ高かった。
引用
"臨床試験では、多数の医療従事者、患者、データ収集環境が関与するため、高品質なデータを収集することが大きな課題となる。"
"本研究では、話者認証モデルを用いて、同一の臨床試験に複数回参加する患者を検出し排除することを提案する。"