本論文は、2023年のサウンドデミキシングチャレンジの音楽デミキシングトラックについて概説している。
まず、音楽ソース分離の課題と、これまでの研究の歴史について説明している。従来の音楽ソース分離の研究では、大量のクリーンなデータを使うことが重要だと分かっていたが、実際にはデータに誤りが含まれることが問題となることが分かった。
そこで本チャレンジでは、訓練データに含まれる2種類の誤り、ラベルノイズと信号のブリーディングに着目し、これらの誤りに頑健なモデルの開発を目的とした。具体的には、ラベルノイズデータセットとブリーディングデータセットを用意し、参加者にこれらのデータを使ってモデルを訓練することを求めた。
また、従来の音楽ソース分離の課題も設けた。これらのリーダーボードの結果を報告し、上位チームの手法を紹介している。特に、ラベルノイズとブリーディングの課題に対する頑健な手法として、反復的な学習データの改善手法を提案している。
最後に、チャレンジの運営上の課題について述べている。
In eine andere Sprache
aus dem Quellinhalt
arxiv.org
Tiefere Fragen