핵심 개념
본 연구는 사전 음원 정보 없이도 다중 음원을 효과적으로 구분하고 위치를 파악할 수 있는 새로운 방법을 제안한다.
초록
본 논문은 다중 음원 위치 파악 문제를 다룬다. 기존 방법들은 음원의 개수에 대한 사전 정보에 의존하는 한계가 있었다. 이를 해결하기 위해 본 연구는 반복적 객체 식별(IOI) 모듈을 제안한다. IOI 모듈은 음원 개수에 대한 사전 정보 없이도 반복적으로 음원을 식별할 수 있다. 또한 객체 유사도 기반 클러스터링(OSC) 손실 함수를 통해 동일 객체의 영역은 결합하고 다른 객체와 배경은 구분할 수 있도록 한다. 실험 결과, 제안 방법은 기존 방법 대비 단일/다중 음원 위치 파악 성능이 크게 향상되었음을 보여준다.
통계
음원 개수에 대한 사전 정보 없이도 MUSIC 데이터셋에서 52.1%의 CAP, 72.5%의 PIAP, 38.6%의 CloU@0.3, 30.1%의 AUC 성능을 달성했다.
VGGSound 데이터셋에서는 32.5%의 CAP, 44.4%의 PIAP, 46.9%의 CloU@0.3, 29.2%의 AUC 성능을 달성했다.
인용구
"본 연구는 사전 음원 정보 없이도 다중 음원을 효과적으로 구분하고 위치를 파악할 수 있는 새로운 방법을 제안한다."
"제안 방법은 반복적 객체 식별(IOI) 모듈과 객체 유사도 기반 클러스터링(OSC) 손실 함수를 통해 동일 객체의 영역은 결합하고 다른 객체와 배경은 구분할 수 있다."