核心概念
이 챌린지는 화자 음성 정보를 숨기면서도 언어 및 감정 정보를 보존하는 음성 익명화 시스템 개발을 목표로 합니다.
統計資料
화자 식별 정확도(EER)가 10%, 20%, 30%, 40% 이상인 경우에 대해 자동 음성 인식(WER) 및 감정 인식(UAR) 성능을 평가합니다.
기준 시스템 B1은 평균 EER 9.20%, WER 3.07%, UAR 42.71%를 달성했습니다.
기준 시스템 B2는 평균 EER 7.48%, WER 10.44%, UAR 55.61%를 달성했습니다.
기준 시스템 B3, B4, B5, B6은 EER이 각각 25.24%, 32.71%, 34.37%, 23.05%로 더 나은 프라이버시 보호 성능을 보였습니다.
引述
"음성 데이터에는 화자의 신원, 나이, 성별, 건강 상태, 성격, 인종, 지리적 배경, 사회적 정체성, 사회경제적 지위 등 다양한 개인 정보가 포함되어 있습니다."
"이 챌린지는 음성 기술에 대한 프라이버시 보호 솔루션 개발을 주도하고 있습니다."