Core Concepts
データ駆動型のアプローチを用いて、一般的な行動モデルを持つエージェントのゴールを効率的に認識できるよう、意思決定環境を最適化する。
Abstract
本研究では、ゴール認識設計の問題に取り組む。ゴール認識設計とは、エージェントのゴールを容易に推定できるよう、意思決定環境を変更する手法である。従来の研究では、計算コストが高く、最適な行動を取るエージェントを前提としていた。
本研究の提案手法は以下の通り:
機械学習モデルを用いて、環境とエージェントの行動モデルからゴール認識の難易度(worst-case distinctiveness, wcd)を予測する。
この予測モデルを活用し、勾配ベースの最適化手法を用いて、wcドを最小化するよう環境を変更する。
様々な制約条件(予算制約、複雑な環境、非最適な行動モデル)にも対応可能。
実験の結果、提案手法は従来手法に比べ、wcドの削減と計算効率の両面で優れた性能を示した。さらに、人間被験者実験により、提案手法が人間の意思決定を考慮した環境設計に有効であることを確認した。
Stats
提案手法は従来手法に比べ、wcドの削減と計算効率の両面で優れた性能を示した。
人間被験者実験の結果、提案手法が人間の意思決定を考慮した環境設計に有効であることが確認された。