本システムは、自然言語のプロンプトをJSON形式の作曲パラメータにマッピングするための自己回帰型トランスフォーマー言語モデルを利用しています。定義された構造には、拍子、スケール、コード進行、バランス-覚醒値が含まれ、それらに基づいて伴奏、メロディ、ベース、モチーフ、パーカッションのトラックが作成されます。
メロディ要素の生成には遺伝的アルゴリズムを提案しており、音楽的に意味のある変異と、正規分布と事前定義された音楽的特徴値に基づくフィットネス関数を組み込んでいます。これらの値は、感情的なパラメータと特徴的な演奏スタイルの影響を受けて適応的に変化します。
任意の拍子のパーカッションを生成するシステムは、マルコフ連鎖を含む確率的手法を利用しています。
人間による評価と客観的な評価の両方を通じて、提案するミュージック生成アプローチが特定の音楽的に意味のあるメトリックでベースラインを上回ることを示しており、純粋なニューラルネットワークベースのシステムに対する有益な代替手段を提供しています。
На другой язык
из исходного контента
arxiv.org
Дополнительные вопросы