본 논문에서는 오디오 신호 디클리핑 문제를 해결하기 위해 정규화된 자기회귀 모델링 프레임워크를 제안하고, 이를 기존 방법들과 비교하여 그 성능을 입증합니다. 특히, 약하게 클리핑된 신호에 대해서 제안된 방법이 우수한 성능을 보입니다.
사용자 정의 의미 속성을 기반으로 StyleGAN의 잠재 공간에서 유도 벡터를 찾아 오디오 텍스처를 제어할 수 있는 예시 기반 프레임워크를 제안한다.
본 논문은 자동 미분을 통해 효율적으로 학습할 수 있는 시변 전극 필터를 제안한다. 이를 통해 다양한 오디오 효과와 합성기 모델링에 활용할 수 있다.
마스크드 예측 기반 자기지도학습 방법인 마스크드 모델링 듀오(M2D)를 제안하고, 이를 확장한 M2D-X를 통해 다양한 응용 분야에 특화된 표현을 학습할 수 있는 범용 오디오 사전학습 프레임워크를 제시한다.
단일 소스 오디오 샘플에 대한 접근 없이도 언어 정보를 활용하여 오디오 혼합물에서 단일 소스 신호를 효과적으로 분리할 수 있는 일반화된 약한 감독 학습 프레임워크를 제안한다.
아날로그 동적 범위 압축기의 디지털 모델을 개발하기 위해 딥러닝과 상태 공간 모델을 사용하는 새로운 접근 방식을 제안한다.
실시간 저지연 환경에서 사용자가 지정한 타겟 사운드를 입력 혼합음에서 효과적으로 추출하기 위해 맥락 정보를 활용하는 방법을 제안한다.
청각 신호에 대한 딥러닝 모델의 예측을 해석하기 위해 청취 가능한 맵을 생성하는 방법을 제안한다.
인기 있는 오디오 인페인팅 방법에 대한 자기회귀 모델링을 평가하고, AR 모델 추정기의 선택의 중요성과 새로운 갭별 Janssen 방법의 적합성을 입증했습니다.