本論文は、不完全情報下での順次的な双方向の交渉問題を扱っている。プレイヤーが間接的な交渉を行い、相手のモデルを学習することで、交渉に成功できるようなモデルを提案している。方法論的には、ヒューリスティックに動機付けられた自己利益的な独立プレイヤーの交渉を、ベイズ学習とマルコフ決定過程のフレームワークに落とし込んでいる。報酬関数の特殊な形式が、プレイヤーに間接的な交渉を促し、交渉範囲に制限をかける。提案モデルをナッシュ需要ゲームに適用した結果、i)プレイヤーの行動を調整すること、ii)ゲームの成功率を最大化すること、iii)プレイヤーの個人的な利益を高めることが示された。
Para outro idioma
do conteúdo fonte
arxiv.org
Principais Insights Extraídos De
by Tati... às arxiv.org 09-11-2024
https://arxiv.org/pdf/2409.06566.pdfPerguntas Mais Profundas