본 연구는 음향 이벤트 탐지, 위치 추정 및 거리 측정을 통합적으로 수행하는 방법을 제안한다. 두 가지 접근법을 연구했는데, 하나는 다중 작업 모델이고 다른 하나는 확장된 ACCDOA 방식이다.
다중 작업 모델에서는 SELD와 거리 추정을 위한 두 개의 독립적인 출력 브랜치를 사용한다. 다양한 손실 함수를 실험하여 거리 추정 성능을 최적화하고자 했다.
확장된 ACCDOA 방식은 기존의 ACCDOA 출력에 거리 정보를 추가한 것이다. 이를 통해 단일 작업 접근법으로 세 가지 과제를 동시에 해결할 수 있다.
실험은 Ambisonic과 바이노럴 오디오 데이터셋에서 수행되었다. 결과적으로 확장된 ACCDOA 방식에 MSE 손실 함수를 사용한 모델이 가장 우수한 성능을 보였다. 하지만 거리 추정 부분에서는 MAE 손실 함수가 더 효과적인 것으로 나타났다. 향후 연구에서는 SELD와 거리 추정을 위한 혼합 손실 함수를 고려해볼 필요가 있다.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Daniel Aleks... at arxiv.org 03-19-2024
https://arxiv.org/pdf/2403.11827.pdfDeeper Inquiries