핵심 개념
COL은 베이지안 학습을 통해 수렴하는 합리적인 전략을 제공합니다.
초록
Abstract
AISG에서 COL은 베이지안 학습을 사용하여 전략을 조정하고 Berk-Nash 평형으로 수렴합니다.
Introduction
STS에서 정보 비대칭성은 의사결정 주체에게 도전을 제공합니다.
AISG의 특수 클래스를 대상으로 한 이전의 계산 방법은 믿음 계층을 피합니다.
Conjectural Online Learning
COL은 FAC 아키텍처로 구성되어 있으며, 미래 전략을 추측하고 전략을 업데이트합니다.
COL은 정보 피드백을 통해 추측을 보정하고 Berk-Nash 평형으로 수렴합니다.
Equilibrium Analysis in Repeated Games
COL은 AISG의 베이지안 평형 개념과 연결되어 있습니다.
Case Study: Intrusion Response
COL은 실제 APT에 대한 IT 인프라를 보호하기 위한 방어를 수행합니다.
COL은 온라인 PPO 및 근사 최적 반응 동역학에 비해 우수한 성능을 보입니다.
통계
COL은 Berk-Nash 평형으로 수렴합니다.
인용구
"COL은 베이지안 학습을 통해 수렴하는 합리적인 전략을 제공합니다."