核心概念
エージェントの振る舞いを理解し、その意図を定量的に把握することで、エージェントの行動を「何を」「どのように」「なぜ」説明できるようにする。
要約
本論文では、エージェントの振る舞いを理解し、その意図を定量的に把握するための手法を提案する。
まず、部分的な観察データからエージェントの方策グラフを構築する。方策グラフは、エージェントの状態遷移確率と行動確率を表す確率的グラフモデルである。
次に、人間が仮定したエージェントの欲求(desire)を方策グラフに導入し、その達成可能性を定量的に評価する。さらに、エージェントの意図(intention)を定義し、その強さを定量化する。
これにより、エージェントの行動を「何を」(達成しようとしているか)、「どのように」(その目的をどのように達成しようとしているか)、「なぜ」(なぜその行動を取ったのか)と説明することができる。
また、意図の強さに応じて説明の信頼性と解釈可能性のトレードオフを調整できる。
最後に、この手法を用いて、オーバークックという協調型強化学習環境のエージェントの振る舞いを分析し、その有効性を示す。
統計
状態sにおいて欲求dを達成する確率は P(s ∈Sd)
状態sにおいて欲求dに対する行動adを取る確率は P(ad|s ∈Sd)
引用
「現在の状態でどのような意図を持っているか」
「その意図をどのように達成しようとしているか」
「なぜ今この行動を取っているのか」