이 연구는 임상 시험에서 발생할 수 있는 중복 참여 문제를 해결하기 위해 화자 검증(SV) 기술을 활용하는 방법을 제안한다.
주요 내용은 다음과 같다:
임상 시험에 참여하는 환자들의 음성 데이터를 활용하여 환자 식별 및 중복 참여 방지를 위한 제로샷 화자 검증 모델을 제안하였다.
영어, 독일어, 덴마크어, 스페인어, 아랍어 등 다양한 언어로 구성된 데이터셋을 활용하여 TitaNet, ECAPA-TDNN, SpeakerNet 모델의 성능을 평가하였다.
유럽 언어에서는 2.7% 미만의 EER을 달성하였으며, 아랍어에서도 8.26%의 EER을 달성하여 다국어 환경에서 우수한 성능을 보였다.
다양한 언어와 음성 과제 유형에 걸쳐 일반화가 가능한 화자 검증 모델을 제시함으로써, 임상 시험에서 중복 참여 문제를 해결할 수 있는 실용적인 솔루션을 제안하였다.
언어 간 유사성, 음성 과제 유형, 데이터 수집 절차 등이 화자 검증 성능에 미치는 영향을 분석하였다.
לשפה אחרת
מתוכן המקור
arxiv.org
תובנות מפתח מזוקקות מ:
by Ali Akram,Ma... ב- arxiv.org 04-03-2024
https://arxiv.org/pdf/2404.01981.pdfשאלות מעמיקות