이 논문은 자기지도 학습 화자 검증 시스템의 성능 향상을 위한 방법을 제안한다. 대부분의 최신 자기지도 학습 화자 검증 시스템은 레이블이 없는 음성 데이터에서 화자 표현을 학습하기 위해 대조적 손실 함수를 사용한다.
저자들은 다음과 같은 방법을 통해 이러한 방법의 성능을 향상시켰다:
대칭적 대조 손실은 자기지도 학습 작업에 더 많은 감독 신호를 제공하여 성능 향상을 가져왔다. 또한 가산 마진과 가산 각도 마진은 화자 간 분리도를 높여 전체적인 거짓 긍정과 거짓 부정을 줄였다.
이러한 기술을 결합하고 더 큰 모델을 학습시킴으로써 VoxCeleb1 테스트 세트에서 7.50% EER과 0.5804 minDCF를 달성하여 다른 대조적 자기지도 학습 방법을 능가하는 성능을 보였다.
To Another Language
from source content
arxiv.org
ข้อมูลเชิงลึกที่สำคัญจาก
by Theo Lepage,... ที่ arxiv.org 04-26-2024
https://arxiv.org/pdf/2306.03664.pdfสอบถามเพิ่มเติม