Core Concepts
MEDIATE は、エージェントの価値関数に基づいて自動的にトークン値を導出し、プライバシーを保護しつつ合意形成するメカニズムを提案する。これにより、様々な社会的ジレンマ環境において、効率的な協力を実現する。
Abstract
本研究では、相互承認型分散型インセンティブ交換プロトコル「MEDIATE」を提案している。MEDIATE は、以下の2つの主要な進展を組み合わせている:
自動的なトークン値導出メカニズム
エージェントの価値関数に基づいて、各エージェントが独自のトークン値を動的に計算する。
これにより、環境に応じて適切なトークン値を設定できる。
プライバシー保護の合意形成メカニズム
エージェントは、秘密分散法を用いて、プライバシーを保ちつつ、全エージェントで合意された共通のトークン値を導出する。
これにより、分散環境でも公平な協力を実現できる。
実験結果から、MEDIATE は様々な社会的ジレンマ環境において、効率的な協力を実現できることが示された。MEDIATE は、固定トークン値を使用するMATEよりも優れた性能を発揮し、他の手法と比べても最高水準の協力を達成した。特に、報酬構造が複雑な環境や、部分的に接続された環境でも優れた適応性を示した。
Stats
報酬の最小値|rmin
i
|は、トークン値の更新に使用される。
トークン値Tiは、エージェントiの価値関数の平均値の差分に基づいて更新される。