유한한 행동과 상태를 가진 커뮤니케이션 게임에서 발신자에게 약속이 가치 있는 경우는 발신자가 무작위 전략을 선호하는 경우뿐이며, 이는 베이지안 설득 문제에서 부분적 실험이 아닌 무작위 실험이 최적일 때 발생한다.
Bayesian persuasion studies strategic information disclosure to influence behavior.
The authors introduce Markov persuasion processes (MPPs) to address sequential scenarios where a sender interacts with myopic receivers in an unknown environment. They propose an algorithm that optimizes regret and violation trade-offs in learning without knowledge of receiver rewards.