이 논문은 BEAST라는 온라인 비트 및 다운비트 추적 시스템을 제안한다. BEAST는 스트리밍 트랜스포머 인코더를 기반으로 하며, 다음과 같은 핵심 특징을 가진다:
문맥 블록 처리 메커니즘: 입력 시퀀스를 여러 블록으로 나누어 처리하여 온라인 처리를 가능하게 한다. 각 블록에는 이전 블록의 문맥 정보를 전달하여 장기 의존성을 유지한다.
상대적 위치 인코딩: 절대적 위치 인코딩 대신 상대적 위치 관계를 인코딩하여 음악의 리듬 구조를 더 잘 포착한다.
실험 결과, BEAST는 기존 온라인 비트 및 다운비트 추적 모델들에 비해 약 5%p 이상의 F1-score 향상을 보였다. 또한 46ms의 낮은 지연시간에서도 우수한 성능을 달성하였다.
이는 스트리밍 트랜스포머 구조를 음악 정보 검색 분야에 처음 적용한 사례로, 실시간 전사, 실시간 반주 생성 등 다른 응용 분야에도 활용될 수 있을 것으로 기대된다.
На другой язык
из исходного контента
arxiv.org
Дополнительные вопросы