이 논문은 노래 가사와 음표 전사 및 정렬을 위한 SongTrans 모델을 제안한다. 기존의 도구들은 전처리 과정이 필요하거나 단일 작업만 수행할 수 있었지만, SongTrans는 이러한 한계를 극복하였다.
SongTrans 모델은 두 가지 모듈로 구성된다:
실험 결과, SongTrans는 기존 가사 전사 모델보다 월등한 성능을 보였고, 음표 전사 모델과도 경쟁력 있는 결과를 보였다. 또한 SongTrans는 가사와 음표를 동시에 정렬할 수 있는 최초의 모델이다.
추가로, SongTrans는 다양한 환경(반주 포함, 묵음 구간 포함)에서도 효과적으로 작동하는 것으로 나타났다.
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문