本論文は、音楽ソース分離(MSS)のための新しい2段階バンド分割Mamba-2ネットワークを提案している。
まず、第1段階では複素数マスクを推定し、粗い特徴を学習する。次に第2段階では残差マッピングを推定し、細かい特徴を捉える。Mamba-2アーキテクチャを採用することで、効率的な系列モデリングが可能となる。
実験の結果、提案手法は既存手法と比べて優れた分離性能を示し、計算量も少ないことが確認された。特に2段階アプローチの有効性が示された。また、軽量版のモデルも良好な結果を得ている。
全体として、Mamba-2を活用した2段階バンド分割ネットワークが音楽ソース分離に有効であることが明らかになった。
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問