이 연구는 임상 시험에서 발생할 수 있는 중복 참여 문제를 해결하기 위해 화자 검증(SV) 기술을 활용하는 방법을 제안한다.
주요 내용은 다음과 같다:
임상 시험에 참여하는 환자들의 음성 데이터를 활용하여 환자 식별 및 중복 참여 방지를 위한 제로샷 화자 검증 모델을 제안하였다.
영어, 독일어, 덴마크어, 스페인어, 아랍어 등 다양한 언어로 구성된 데이터셋을 활용하여 TitaNet, ECAPA-TDNN, SpeakerNet 모델의 성능을 평가하였다.
유럽 언어에서는 2.7% 미만의 EER을 달성하였으며, 아랍어에서도 8.26%의 EER을 달성하여 다국어 환경에서 우수한 성능을 보였다.
다양한 언어와 음성 과제 유형에 걸쳐 일반화가 가능한 화자 검증 모델을 제시함으로써, 임상 시험에서 중복 참여 문제를 해결할 수 있는 실용적인 솔루션을 제안하였다.
언어 간 유사성, 음성 과제 유형, 데이터 수집 절차 등이 화자 검증 성능에 미치는 영향을 분석하였다.
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Ali Akram,Ma... lúc arxiv.org 04-03-2024
https://arxiv.org/pdf/2404.01981.pdfYêu cầu sâu hơn