Core Concepts
Die NES-VMDB-Datenbank enthält 98.940 Gameplay-Videos von 389 NES-Spielen, die jeweils mit der zugehörigen Hintergrundmusik in symbolischem Format (MIDI) gepaart sind. Ziel ist es, Generierungsmodelle zu unterstützen, die Musik aus Gameplay-Videos komponieren können.
Abstract
Die NES-VMDB-Datenbank ist eine Erweiterung des Nintendo Entertainment System Music Database (NES-MDB) Datensatzes. Sie umfasst 98.940 Gameplay-Videos von 389 NES-Spielen, die mit 4.070 Musikstücken aus dem NES-MDB-Datensatz verknüpft sind.
Um die Videos mit den MIDI-Dateien zu paaren, wurden die Gameplay-Videos in 15-Sekunden-Clips unterteilt und deren Audio extrahiert. Anschließend wurde ein Fingerabdruck-Algorithmus verwendet, um die am besten passenden MIDI-Dateien aus dem NES-MDB-Datensatz zu finden und diese mit den entsprechenden Videoclips zu verknüpfen.
Zusätzlich zu dem Datensatz wurde ein Baseline-Generator basierend auf dem Controllable Music Transformer (CMT) entwickelt. Dieser Generator wurde mit den NES-VMDB-MIDI-Stücken trainiert und kann dann neue Musik generieren, indem er Rhythmusmerkmale aus Gameplay-Videos als Eingabe verwendet. Die generierten Stücke wurden mit unbedingt generierten Stücken und menschlich komponierten Stücken verglichen. Die Ergebnisse zeigen, dass die bedingt generierten Stücke eine Struktur aufweisen, die menschlich komponierten Stücken ähnlicher ist als die unbedingt generierten.
Darüber hinaus wurde ein neuronaler Klassifikator trainiert, um das Spielgenre der generierten Stücke vorherzusagen. Die Ergebnisse zeigen, dass der bedingte CMT-Generator Korrelationen zwischen Gameplay-Videos und Spielgenres lernen kann, aber weitere Forschung erforderlich ist, um menschliches Niveau zu erreichen.
Stats
Die NES-VMDB-Datenbank umfasst insgesamt 98.940 Gameplay-Videos von 389 NES-Spielen.
Die Gameplay-Videos summieren sich auf insgesamt 474 Stunden Video.
Quotes
Keine relevanten Zitate gefunden.