核心概念
본 논문은 단성 전사에 의존하지 않고 복잡한 악보를 효과적으로 전사할 수 있는 Sheet Music Transformer(SMT)라는 이미지 대 시퀀스 모델을 제안한다.
摘要
본 논문은 기존 광학 음악 인식(OMR) 기술의 한계를 극복하고자 단성 전사에 의존하지 않는 종합적인 접근법을 제안한다.
- 기존 OMR 기술은 주로 단성 전사 기법을 사용하여 복잡한 악보 구조(예: 다성부)를 다루어왔으나, 이는 확장성 및 제한적 문제가 있었다.
- 본 논문에서는 Sheet Music Transformer(SMT)라는 이미지 대 시퀀스 모델을 제안한다. SMT는 자기회귀 Transformer 기반으로, 단성 전략에 의존하지 않고 복잡한 악보를 효과적으로 전사할 수 있다.
- 실험 결과, SMT는 기존 최신 기술 대비 우수한 성능을 보였으며, 특히 피아노 악보와 현악 4중주 악보에서 두드러진 성과를 달성했다.
- SMT는 기존 OMR 기술의 한계를 극복하고 복잡한 악보 전사를 가능하게 하는 새로운 접근법을 제시한다.
統計資料
악보 이미지 한 장당 약 7초 분량의 음악 excerpt로 구성되어 있다.
Quartets 데이터셋의 학습 세트에는 하이든 18,162개, 모차르트 7,435개, 베토벤 12,454개의 샘플이 포함되어 있다.
引述
"본 논문에서는 단성 전사에 의존하지 않고 복잡한 악보를 효과적으로 전사할 수 있는 Sheet Music Transformer(SMT)라는 이미지 대 시퀀스 모델을 제안한다."
"실험 결과, SMT는 기존 최신 기술 대비 우수한 성능을 보였으며, 특히 피아노 악보와 현악 4중주 악보에서 두드러진 성과를 달성했다."