本論文は、不完全情報下での順次的な双方向の交渉問題を扱っている。プレイヤーが間接的な交渉を行い、相手のモデルを学習することで、交渉に成功できるようなモデルを提案している。方法論的には、ヒューリスティックに動機付けられた自己利益的な独立プレイヤーの交渉を、ベイズ学習とマルコフ決定過程のフレームワークに落とし込んでいる。報酬関数の特殊な形式が、プレイヤーに間接的な交渉を促し、交渉範囲に制限をかける。提案モデルをナッシュ需要ゲームに適用した結果、i)プレイヤーの行動を調整すること、ii)ゲームの成功率を最大化すること、iii)プレイヤーの個人的な利益を高めることが示された。
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문