Core Concepts
불규칙적으로 샘플링된 시간-주파수 데이터에 대해 비음수 행렬 분해를 수행할 수 있는 새로운 접근법을 제안한다. 이를 위해 암묵적 신경 표현을 활용하여 연속적인 함수 형태로 스펙트럼 템플릿과 활성화 함수를 모델링한다.
Abstract
이 논문은 비음수 행렬 분해(NMF)를 불규칙적으로 샘플링된 데이터에 적용할 수 있는 새로운 접근법을 제안한다. 기존의 NMF는 정규적으로 샘플링된 데이터(예: STFT 스펙트로그램)에 적용되었지만, 가변 해상도 시간-주파수 표현(예: CQT, 웨이블릿 변환)과 같은 불규칙적으로 샘플링된 데이터에는 적용할 수 없었다.
저자들은 이러한 문제를 해결하기 위해 암묵적 신경 표현을 활용한 새로운 NMF 모델(iN-NMF)을 제안한다. iN-NMF에서는 스펙트럼 템플릿과 활성화 함수를 연속적인 함수로 모델링하여, 입력 데이터의 샘플링 방식에 구애받지 않고 NMF를 수행할 수 있다.
실험 결과, iN-NMF는 정규 샘플링된 스펙트로그램에 대해서도 기존 NMF와 유사한 성능을 보였으며, 불규칙적으로 샘플링된 데이터에 대해서도 효과적으로 작동하였다. 또한 iN-NMF는 학습된 템플릿을 다른 샘플링 방식의 입력에 적용할 수 있어, 해상도 및 샘플링 속도에 독립적인 모델을 구축할 수 있다.
Stats
불규칙적으로 샘플링된 시간-주파수 데이터는 (시간, 주파수, 크기) 튜플의 집합으로 표현할 수 있다.
iN-NMF에서는 스펙트럼 템플릿 {Wk}와 활성화 함수 {Hk}를 연속적인 함수로 모델링한다.
정규 샘플링된 스펙트로그램에 대해 iN-NMF와 NMF의 KL 발산 성능이 유사하다.
iN-NMF는 한 번의 학습으로 다양한 해상도의 입력에 적용할 수 있다.
Quotes
"우리는 시간-주파수 표현을 시간-주파수 공간의 점들로 생각할 수 있다."
"우리의 접근법은 정규 샘플링된 표현뿐만 아니라 CQT, 웨이블릿 변환, 사인파 분석 모델과 같은 다양한 신호 클래스에 NMF를 확장할 수 있게 해준다."