核心概念
그래프에서 팀 조정 문제를 해결하기 위해 강화 학습 기술을 사용하여 팀원 간의 협력 행동을 가능하게 하는 방법을 연구합니다.
统计
"우리는 RL을 사용하여 팀 조정 문제를 해결하기 위해 두 가지 패러다임에서 RL을 사용하는 방법을 조사합니다."
"RL은 그래프에서 탐색을 통해 에이전트가 시행착오 경험을 통해 학습할 수 있는 잠재력을 가지고 있습니다."
引用
"RL은 그래프에서 팀원 간의 협력 행동을 생성할 수 있는 잠재력을 가지고 있습니다."
"우리는 RL을 사용하여 그래프에서의 팀 조정 문제를 해결하기 위한 새로운 MDP 공식으로 변환합니다."