Konsep Inti
適応可能な消費者は、環境の動的要因の存在を検知し、最大限の効用を得るためにFIREモデルかCAモデルのいずれかを選択的に使用することができる。
Abstrak
本論文では、オープンマルチエージェントシステムにおける信頼性の高いパートナーを特定する課題に取り組んでいる。従来の信頼管理手法には、エージェントの移動性や不安定な行動への対応が困難という重大な弱点がある。
著者らは以前に提案したCAモデルと、既存の信頼・評判モデルであるFIREモデルを比較し、消費者集団の変化に対してはCAが優れ、提供者集団の変化に対してはFIREが強靭であることを示した。
本論文では、消費者がどのように環境の動的要因の存在を検知し、最大の効用を得るためにどのモデルを使うべきかを学習する問題に取り組んでいる。これは部分的に観測可能な環境下での強化学習の問題として定式化される。消費者は9つの特徴量を計算し、ディープQ学習を用いて適応的に最適な行動を学習する。
一連のシミュレーション実験の結果、適応可能な消費者は環境の変化に応じて適切なモデルを選択することを学習し、安定した高い性能を発揮することが示された。
Statistik
消費者集団の変化率が最大10%の場合、適応可能な消費者の平均効用は、FIREモデルを使う消費者よりも高い。
提供者集団の変化率が最大10%の場合、適応可能な消費者の平均効用は、CAモデルを使う消費者よりも高い。
提供者の平均パフォーマンスが最大1.0 UG単位変化する確率が10%の場合、適応可能な消費者の平均効用は、FIREモデルやCAモデルを使う消費者よりも高い。
Kutipan
"適応可能な消費者は、環境の変化に応じて適切なモデルを選択することを学習し、安定した高い性能を発揮することができる。"
"消費者は9つの特徴量を計算し、ディープQ学習を用いて適応的に最適な行動を学習する。"