Khái niệm cốt lõi
人間と動物社会での協力を促進するために、強化学習エージェントが支配階層を発明し、伝達する能力を示す。
Tóm tắt
この論文では、強化学習アルゴリズムが個々のエージェントとグループ目標のバランスを取ることで成功裏に協力し、支配階層を発明、学習、施行し、新しい集団に伝達する能力を実証しています。多くの動物種や人間社会で見られる協力の基盤である支配階層に焦点を当てており、エージェントが最小限の環境ルールから支配階層を発展させる方法を示しています。また、観察信号にランダムノイズを追加することでエージェント同士の関係性や支配階層形成への影響も調査しています。
Thống kê
チキンコープ環境でトレーニングされた6つのエージェントが300個体群で収束した248種類の異なる支配階層が観察されました。
80%以上の中央値信頼度で2つの経験豊富なエージェントが4つの未経験エージェントに元々持っていた支配階層を教え込むことが可能です。
Trích dẫn
"多くの動物種や人間社会で見られる協力の基盤である支配階層に焦点を当てており"
"観察信号にランダムノイズを追加することでエージェント同士の関係性や支配階層形成への影響も調査しています"