Core Concepts
강화 학습 에이전트들이 지배 계층 구조를 발명하고 전파하는 능력을 증명함.
Abstract
최신 강화 학습 알고리즘은 다양한 작업에서 인간을 능가함.
다중 에이전트 강화 학습 환경에서 성공적인 협력은 개인과 그룹 목표 사이의 균형에 달려있음.
본 논문에서는 동물과 인간 사회에서 협력의 기초인 지배 계층 구조를 인공 에이전트에 적용함.
강화 학습 에이전트들은 명시적 프로그래밍이나 내재적 보상 없이 지배 계층을 발명, 학습, 시행 및 전파함.
지배 계층은 치킨, 쥐, 물고기 등 다양한 종의 연구에서 발견된 구조와 유사함.
Stats
인간을 능가하는 작업에서 강화 학습 알고리즘의 성능이 입증됨.
Quotes
"강화 학습 에이전트들은 명시적 프로그래밍이나 내재적 보상 없이 지배 계층을 발명, 학습, 시행 및 전파할 수 있음."
"지배 계층은 치킨, 쥐, 물고기 등 다양한 종의 연구에서 발견된 구조와 유사함."