Core Concepts
ジャズ即興演奏における最も効果的な戦略は、コードに従った強化学習戦略と段階的変化戦略の組み合わせです。
Abstract
音楽のライブパフォーマンスは常に魅力的であり、ジャズ即興演奏はその理論的側面から注目されています。本研究では、ジャズ即興演奏のための新しい数学的ゲーム理論モデルを紹介し、音楽理論と即興法を研究する枠組みを提供しています。計算モデリングを使用して、主に強化学習を用いて様々な確率的な即興戦略を探求しました。最も効果的な戦略ペアは、最近の報酬に反応する戦略(段階変化)と与えられたコード内のノートに限定される強化学習戦略(コードに従う強化学習)であることが示されました。一方、相手プレイヤーの直前のノートに反応し調和させようとする戦略(調和予測)は非制御報酬が最低であり、標準偏差が最も高く、パフォーマンスが不安定であることを示しています。平均して、コードに従う強化学習戦略が最も高い平均報酬を示し、調和予測は最低であることが示されました。
Stats
ペアごとの平均報酬:R: 0.16495, CF: 0.43160, SF: 0.34972, HP: 0.31942, SC: 0.41056, SRL: 0.42838, CFRL: 0.45414, CSR: 0.40332, TPRL: 0.42157
最低平均報酬ペア:2人がランダムプレイヤーである場合(制御)
最低非制御ペア平均報酬:ランダムプレイヤーと調和予測ストラテジーである場合(非制御)
最低リアルストラテジー平均報酬:2人が調和予測ストラテジーである場合(リアル)
Quotes
"Within the context of what everybody else played, did what I just play sound good or bad?"
"Our work lays the foundation for promising applications beyond jazz."
"In a typical jazz song, musicians will constantly improvise at varying levels of freedom throughout."