Praktische End-to-End-Optische Musikerkennung für Klaviermusik
Wir definieren ein sequentielles Format namens Linearized MusicXML, um ein End-to-End-Modell direkt zu trainieren und die enge Kohäsion und Kompatibilität mit dem branchenüblichen MusicXML-Format beizubehalten. Wir erstellen außerdem einen Entwicklungs- und Testdatensatz für die Benchmark-Typesetting-OMR mit MusicXML-Grundwahrheit basierend auf dem OpenScore Lieder Corpus. Schließlich trainieren und verfeinern wir ein End-to-End-Modell, um als Baseline auf dem Datensatz zu dienen, und verwenden die TEDn-Metrik, um das Modell zu bewerten. Wir testen unser Modell auch gegen den kürzlich veröffentlichten synthetischen Klaviermusik-Datensatz GrandStaff und übertreffen die State-of-the-Art-Ergebnisse.