본 연구는 음향 장면 매핑을 위한 새로운 무감독 접근법을 제안한다. 기존의 음향 SLAM 방법은 도착 시간 차이(TDOA) 추정에 의존하지만, 이는 잔향 환경에서 성능이 크게 저하된다.
대신 본 연구는 음향 전달 함수(RTF)를 특징으로 사용하고 최근 제안된 지역 컨포멀 오토인코더(LOCA) 차원 축소 기법을 적용한다. RTF는 공간 정보를 포함하는 고차원 음향 벡터이며, 음향 신호 처리 분야에서 성공적으로 활용되어 왔다. LOCA는 국소적 선형성을 활용하여 관측 공간의 비선형 구조를 효과적으로 복원할 수 있다.
실험 결과, 제안 방법은 기존 접근법에 비해 매핑 정확도와 계산 효율성이 크게 향상되었다. 또한 학습 과정에서 관찰되지 않은 영역에 대해서도 효과적으로 외삽할 수 있음을 보였다. 잔향 수준이 증가하더라도 제안 방법은 상당한 강건성을 보였다.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Idan Cohen,O... at arxiv.org 03-14-2024
https://arxiv.org/pdf/2301.00448.pdfDeeper Inquiries