이 논문은 고해상도 피아노 전사 시스템의 한계를 해결하기 위해 제안된 방법을 소개한다.
첫째, 입력 표현으로 Constant-Q Transform (CQT)를 사용하여 음악 신호에 더 잘 적응할 수 있도록 하였다.
둘째, 두 가지 새로운 아키텍처를 설계하였다:
실험 결과, 제안된 모델들은 기존 고해상도 시스템에 비해 일관되게 향상된 성능을 보였으며, 모델 크기도 크게 감소하였다. 이를 통해 자원 소모 없이도 우수한 전사 성능을 달성할 수 있음을 보여주었다.
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Jinyi Mi, Se... alle arxiv.org 10-01-2024
https://arxiv.org/pdf/2409.19614.pdfDomande più approfondite