Główne pojęcia
아날로그 동적 범위 압축기의 디지털 모델을 개발하기 위해 딥러닝과 상태 공간 모델을 사용하는 새로운 접근 방식을 제안한다.
Streszczenie
이 연구는 아날로그 동적 범위 압축기(DRC)의 디지털 모델을 개발하기 위한 새로운 접근 방식을 제안한다. DRC는 비선형적이고 장기 의존성을 가지고 있어 모델링이 어려운 오디오 효과이다. 이 연구에서는 구조화된 상태 공간 시퀀스 모델(S4)을 사용하여 Teletronix LA-2A 아날로그 DRC를 모델링한다. 제안된 모델은 인과적이고 실시간 실행이 가능하며, 이전 딥러닝 모델과 유사한 품질을 달성하지만 더 적은 매개변수를 사용한다. 실험 결과, 제안된 모델은 시간 및 주파수 영역 손실 지표에서 우수한 성능을 보였으며, 주관적 청취 테스트에서도 기존 모델과 유사한 결과를 보였다. 또한 실시간 처리가 가능한 것으로 나타났다.
Statystyki
제안된 ssm-c32-f4 모델은 시간 영역 손실 지표에서 가장 우수한 성능을 보였다.
제안된 ssm-c32-f8 모델은 주파수 영역 손실 지표에서 가장 우수한 성능을 보였다.
제안된 ssm-c16-f8 모델은 LUFS 차이에서 가장 우수한 성능을 보였다.
Cytaty
"S4 layers are also parameter efficient, given that for filters with a similar effect, IIR systems require fewer parameters."
"Our ssm-c32-f4 model has the best time-domain losses among all our models and outperforms all causal TCN models in all metrics."
"The ssm-c32-f4 model has relatively good objective accuracy that is causal, parameter efficient, and real-time capable."