이 논문은 오디오 효과 RNN 모델의 샘플링 레이트를 변경하는 방법을 제안한다. 기존 RNN 모델은 학습 시 인코딩된 고정 샘플링 레이트를 가지므로, 추론 시 다른 레이트로 처리하기 어렵다. 이를 해결하기 위해 상향 및 하향 샘플링을 위한 보간 필터를 사용한다.
상향 샘플링의 경우, 기존 연구에서 제안된 분수 지연 필터를 활용한다. 하향 샘플링의 경우 새로운 방법으로 분수 신호 전진을 근사하는 보간 필터를 제안한다. 라그랑주 보간과 미니맥스 필터 설계 방법을 고려하며, 필터 차수가 오디오 품질에 미치는 영향을 분석한다.
실험 결과, 적절한 필터 선택 시 최대 80dB의 SNR을 달성할 수 있지만, 일부 모델에서는 필터 선택에 따라 오히려 성능이 저하되는 경우가 있다. 이러한 실패 사례는 모델 고정점 주변의 선형 분석을 통해 예측할 수 있다. 이를 통해 실행 전 안정성을 보장하는 최적의 필터를 선택할 수 있다.
На другой язык
из исходного контента
arxiv.org
Дополнительные вопросы