Alapfogalmak
期待効用最大化者間の誤調整を軽減するための安全なパレート改善(SPIs)の重要性と有効性を検証。
Kivonat
人工知能システムが他のエージェントと協力する際に生じる誤調整問題への対処方法に焦点を当て、プログラムゲームでの安全なパレート改善(SPIs)の構築方法や利点について詳細に探求。プログラムゲームフレームワークと主観的均衡、OCによる安全なパレート改善、条件付き再交渉セットを使用した保証されたPMMペイオフなどが議論されています。
Statisztikák
合意セット:AS(RNi, RN−i, a)はTn j=1 RNj(RN−j, a)である。
ペアトミート最小値(PMM):uPMM = (mina∈E ui(a))n i=1。
条件付き再交渉関数:RNi(K) = (RNi(1), ..., RNi(K))。
Idézetek
"Agents in mixed-motive coordination problems such as Chicken may fail to coordinate on a Pareto-efficient outcome."
"Safe Pareto improvements (SPIs) were originally proposed to mitigate miscoordination in cases where players lack probabilistic beliefs."
"We investigate the extent to which SPIs can reduce downsides of miscoordination between expected utility-maximizing agents."