본 연구는 음향 이벤트 탐지, 위치 추정 및 거리 추정을 통합적으로 수행하는 방법을 제안한다. 두 가지 접근법을 비교 분석하였다:
각 접근법에 대해 다양한 손실 함수를 적용하여 성능을 비교하였다. 실험은 Ambisonic 및 바이노럴 오디오 데이터셋에서 수행되었다.
실험 결과, multi-ACCDOA 방식에 MSE 손실 함수를 적용한 모델이 가장 우수한 음향 이벤트 탐지 및 위치 추정 성능을 보였다. 반면, 거리 추정 성능은 MAE 손실 함수를 사용한 모델이 가장 우수하였다. 이는 SELD와 거리 추정 간 최적의 손실 함수가 다름을 시사한다. 향후 연구에서는 이 두 작업을 균형있게 학습할 수 있는 혼합 손실 함수 또는 새로운 모델 구조를 제안할 필요가 있다.
Naar een andere taal
vanuit de broninhoud
arxiv.org
Belangrijkste Inzichten Gedestilleerd Uit
by Daniel Aleks... om arxiv.org 03-19-2024
https://arxiv.org/pdf/2403.11827.pdfDiepere vragen