この論文は、送り手と受け手の間の繰り返し説得設定を研究しています。各時間tにおいて、状態ωtが未知の事前分布から独立かつ同一に引かれ、送り手はその情報を受け手に共有し、受け手は myopically な行動を選択します。送り手は、状態情報を選択的に共有することで、受け手の行動を自身の好みに沿うように説得しようとします。
従来の説得モデルとは対照的に、送り手も受け手も事前分布を知りません。代わりに、送り手は時間の経過とともに事前分布を学習していきます。
送り手の主な目的は、事前分布を知っている最適な説得メカニズムと比べて、低い後悔を達成しつつ、高確率で説得的な行動推奨を行うことです。
論文の主要な貢献は以下の通りです:
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by You Zu,Krish... kl. arxiv.org 05-06-2024
https://arxiv.org/pdf/2102.10156.pdfDybere Forespørgsler