本論文では、音楽生成モデルが長期的な音楽構造を学習することが困難であることを指摘し、その問題に対する解決策として、言語モデルとテキストから音楽生成モデルを統合する手法を提案している。
具体的には以下の通りである:
実験の結果、提案手法により2.5分の長さの構造化された音楽作品を生成できることが示された。音楽専門家による主観評価と、自己類似行列を用いた客観的評価の両方で、提案手法の有効性が確認された。
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Lilac Atassi lúc arxiv.org 10-02-2024
https://arxiv.org/pdf/2410.00344.pdfYêu cầu sâu hơn