Khái niệm cốt lõi
다중 플레이어 자원 공유 게임에서 공정한 보상 할당 모델을 고려한다.
Tóm tắt
다중 플레이어가 자원을 선택하고 무작위 보상을 나누는 게임
두 가지 설정 고려: 1) 평균 보상을 알고 있지만 실현을 관찰하지 않는 1회차 게임, 2) 온라인 시나리오
최악의 경우 예상 효용을 최대화하는 문제 해결
UCB 알고리즘을 개발하여 최악의 경우 후회를 최소화
자원 공유 게임의 확장된 모델과 응용 분야에 대한 논의
Thống kê
플레이어 A1의 최악의 경우 예상 효용을 최대화하는 문제
최악의 후회를 최소화하는 UCB 알고리즘
Trích dẫn
"다중 플레이어 자원 공유 게임에서 공정한 보상 할당 모델을 고려한다."
"UCB 알고리즘을 개발하여 최악의 경우 후회를 최소화"