本研究では、オーケストラ音楽ソース分離のための新しいデータセットSynthSODを開発した。SynthSODは、Symbolic Orchestra Datasetから抽出したMIDIファイルを基に作成されている。MIDI情報にテンポ変化、ダイナミクス変化、アーティキュレーション変化などの音楽的に意味のある注釈を自動的に付与することで、多様性のある高品質な合成音声を生成している。
SynthSODは、47時間以上の音楽信号を含み、楽器ごとの活動時間やポリフォニーレベルが非常に豊富である。これは、小アンサンブルではなく、フルオーケストラをモデル化するのに適している。
SynthSODを使用して、既存の音楽ソース分離モデルを学習させた結果、合成データに対しては良好な分離性能が得られた。一方、実際の録音データに対しては、ドメイン適応などの追加の工夫が必要であることが示された。
本データセットの公開により、オーケストラ音楽ソース分離の研究が大きく進展することが期待される。
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Jaime Garcia... at arxiv.org 09-18-2024
https://arxiv.org/pdf/2409.10995.pdfDeeper Inquiries