이 논문은 노래 가사와 음표 전사 및 정렬을 위한 SongTrans 모델을 제안한다. 기존의 도구들은 전처리 과정이 필요하거나 단일 작업만 수행할 수 있었지만, SongTrans는 이러한 한계를 극복하였다.
SongTrans 모델은 두 가지 모듈로 구성된다:
실험 결과, SongTrans는 기존 가사 전사 모델보다 월등한 성능을 보였고, 음표 전사 모델과도 경쟁력 있는 결과를 보였다. 또한 SongTrans는 가사와 음표를 동시에 정렬할 수 있는 최초의 모델이다.
추가로, SongTrans는 다양한 환경(반주 포함, 묵음 구간 포함)에서도 효과적으로 작동하는 것으로 나타났다.
Іншою мовою
із вихідного контенту
arxiv.org
Ключові висновки, отримані з
by Siwei Wu, Ji... о arxiv.org 09-24-2024
https://arxiv.org/pdf/2409.14619.pdfГлибші Запити