핵심 개념
본 논문에서는 시각적 정보를 활용하여 새로운 유형의 소리를 지속적으로 분리하면서 이전에 학습한 소리에 대한 성능은 유지하는, 지속적인 시청각 음원 분리 작업을 소개하고, 이를 위한 새로운 접근 방식인 ContAV-Sep을 제안합니다.
Pian, W., Nan, Y., Deng, S., Mo, S., Guo, Y., & Tian, Y. (2024). Continual Audio-Visual Sound Separation. Advances in Neural Information Processing Systems, 38. https://arxiv.org/abs/2411.02860v1
본 연구는 실제 환경에서 새로운 음원을 접하는 것이 일반적이라는 점을 고려하여, 이전에 학습한 음원에 대한 성능을 유지하면서 새로운 음원 클래스에 대한 음원 분리를 지속적으로 수행할 수 있는 시청각 음원 분리 모델을 개발하는 것을 목표로 합니다.