핵심 개념
본 논문에서는 보상 분포를 모르는 확률적 협력 게임에서 예상 코어를 학습하는 알고리즘을 제시하고, 엄격하게 볼록한 게임에서 제안된 알고리즘이 다항식 샘플 복잡도를 보장한다는 것을 증명합니다.
초록
엄격하게 볼록한 확률적 협력 게임에서 예상 코어 학습 (연구 논문 요약)
Tran, N. P., Ta, T. A., Shi, S., Mandal, D., Du, Y., & Tran-Thanh, L. (2024). Learning the Expected Core of Strictly Convex Stochastic Cooperative Games. Advances in Neural Information Processing Systems, 38.
본 연구는 보상 함수 또는 분포를 알 수 없는 경우, 확률적 협력 게임에서 데이터 기반 접근 방식을 사용하여 예상 코어를 학습하는 방법을 탐구합니다.