核心概念
주파수 동적 컨볼루션(FDY conv)은 음향 이벤트 탐지 분야에서 중요한 발전이었지만, 다중 기저 커널로 인해 모델 크기가 크게 증가하는 문제가 있었다. 본 연구에서는 부분 주파수 동적 컨볼루션(PFD conv)과 다중 확장 주파수 동적 컨볼루션(MDFD conv)을 제안하여 이 문제를 해결하고 성능을 향상시켰다.
統計資料
주파수 동적 컨볼루션(FDY conv)은 모델 크기를 약 3배 증가시킨다.
부분 주파수 동적 컨볼루션(PFD-CRNN)은 FDY-CRNN 대비 51.9%의 매개변수를 줄일 수 있다.
다중 확장 주파수 동적 컨볼루션(MDFD-CRNN)은 FDY-CRNN 대비 3.17% 향상된 성능을 보였다.
引述
"주파수 동적 컨볼루션(FDY conv)은 음향 이벤트 탐지 분야에서 중요한 발전이었지만, 다중 기저 커널로 인해 모델 크기가 크게 증가하는 문제가 있었다."
"부분 주파수 동적 컨볼루션(PFD conv)은 기존 2D 컨볼루션 출력과 FDY conv 출력을 연결하여 모델 크기를 줄이면서도 성능을 유지할 수 있다."
"다중 확장 주파수 동적 컨볼루션(MDFD conv)은 다양한 확장 크기의 동적 컨볼루션 브랜치와 정적 컨볼루션 브랜치를 하나의 컨볼루션 층에 통합하여 성능을 향상시켰다."