Concepts de base
送り手は、受け手の事前分布を知らない状況下で、受け手を説得的に行動させるアルゴリズムを設計する。このアルゴリズムは、最適な説得メカニズムと比べて、高確率で小さな後悔を達成する。
Résumé
この論文は、送り手と受け手の間の繰り返し説得設定を研究しています。各時間tにおいて、状態ωtが未知の事前分布から独立かつ同一に引かれ、送り手はその情報を受け手に共有し、受け手は myopically な行動を選択します。送り手は、状態情報を選択的に共有することで、受け手の行動を自身の好みに沿うように説得しようとします。
従来の説得モデルとは対照的に、送り手も受け手も事前分布を知りません。代わりに、送り手は時間の経過とともに事前分布を学習していきます。
送り手の主な目的は、事前分布を知っている最適な説得メカニズムと比べて、低い後悔を達成しつつ、高確率で説得的な行動推奨を行うことです。
論文の主要な貢献は以下の通りです:
- 送り手の無知に対する頑健性を活用した、Robustness Against Ignorance (Rai) アルゴリズムを提案しました。
- Rai アルゴリズムが、高確率で説得的であり、かつ√T log T オーダーの平均後悔を達成することを示しました。
- 説得的な任意のアルゴリズムについて、√T オーダーの下限を示しました。これにより、Rai アルゴリズムが最適性を達成することを示しました。
Stats
状態ωtが未知の事前分布から独立かつ同一に引かれる
送り手は事前分布を知らず、時間の経過とともに学習する
受け手は myopically に行動を選択する
Citations
"送り手は、状態情報を選択的に共有することで、受け手の行動を自身の好みに沿うように説得しようとします。"
"送り手の主な目的は、事前分布を知っている最適な説得メカニズムと比べて、低い後悔を達成しつつ、高確率で説得的な行動推奨を行うことです。"