本研究では、SongCreatorと呼ばれる楽曲生成システムを提案している。SongCreatorは、歌詞から高品質な歌と伴奏を同時に生成することができる。
主な特徴は以下の通り:
独自の双方向言語モデル(DSLM)を採用し、歌と伴奏を別々にモデル化しつつ、それらの相互関係を学習する。これにより、歌と伴奏が調和のとれた楽曲を生成できる。
注意マスク戦略を導入し、様々な楽曲生成タスク(歌詞から楽曲生成、伴奏から楽曲生成、楽曲編集など)に対応できるようにした。
広範な実験の結果、SongCreatorは既存手法を大きく上回る性能を示した。特に、歌詞から歌と楽曲を生成するタスクで顕著な改善が見られた。
歌と伴奏の音響条件を個別に制御できる機能も備えている。
以上のように、SongCreatorは高品質な楽曲生成を実現し、様々な楽曲生成タスクに対応可能な汎用的なシステムである。
Egy másik nyelvre
a forrásanyagból
arxiv.org
Mélyebb kérdések