Centrala begrepp
多様性は自然システムにおける回復力を高めることが進化科学から示されているが、従来の多エージェント強化学習手法では均質性を強制することで学習サンプル効率を高めてきた。学習エージェントが均質な方策に制限されない場合、個体が多様な行動を発達させ、システムに相補的な効果をもたらすことがある。しかし、行動の多様性を定量化する手法は驚くほど少ない。そのような手法を開発することで、集合型人工知能における多様性の影響を理解し、その制御を可能にすることができる。
Sammanfattning
本論文では、System Neural Diversity (SND)と呼ばれる多エージェントシステムにおける行動の異質性を測る指標を提案する。その理論的性質を議論し証明し、ロボット分野で使われている最先端の行動多様性指標と比較する。様々な協調型マルチロボットタスクのシミュレーションを通して、SNDがどのように行動の異質性の測定と制御を可能にするかを示す。動的なタスクでは、訓練中に繰り返し攪乱が発生する問題に直面するが、SNDを使うことで、他の代替指標(報酬)では捉えられない潜在的な回復力スキルの獲得を測定できることを示す。最後に、SNDを用いて多様性を制御する方法を示し、探索フェーズを促進し、より効率的な多エージェント強化学習パラダイムを実現できることを実証する。
Statistik
多様性は自然システムの生存に役立つことが生物学者や生態学者によって実証されている。
従来の多エージェント強化学習手法では、パラメータ共有によって均質性を強制することで学習サンプル効率を高めてきた。
学習エージェントが均質な方策に制限されない場合、個体が多様な行動を発達させ、システムに相補的な効果をもたらすことがある。
行動の多様性を定量化する手法は驚くほど少ない。そのような手法を開発することで、集合型人工知能における多様性の影響を理解し、その制御を可能にすることができる。
Citat
"多様性は集合知に不可欠である(Woolley et al., 2015)。"
"生物学者や生態学者は、機能的多様性が生態系の生存に役立つことを実証してきた(Cadotte et al., 2011)。"
"多様性は強化学習における回復力とパフォーマンスの利点をもたらすことが示されている(Bettini et al., 2023)。"