本論文では、エージェントの振る舞いを理解し、その意図を定量的に把握するための手法を提案する。
まず、部分的な観察データからエージェントの方策グラフを構築する。方策グラフは、エージェントの状態遷移確率と行動確率を表す確率的グラフモデルである。
次に、人間が仮定したエージェントの欲求(desire)を方策グラフに導入し、その達成可能性を定量的に評価する。さらに、エージェントの意図(intention)を定義し、その強さを定量化する。
これにより、エージェントの行動を「何を」(達成しようとしているか)、「どのように」(その目的をどのように達成しようとしているか)、「なぜ」(なぜその行動を取ったのか)と説明することができる。
また、意図の強さに応じて説明の信頼性と解釈可能性のトレードオフを調整できる。
最後に、この手法を用いて、オーバークックという協調型強化学習環境のエージェントの振る舞いを分析し、その有効性を示す。
Para Outro Idioma
do conteúdo original
arxiv.org
Principais Insights Extraídos De
by Vict... às arxiv.org 10-01-2024
https://arxiv.org/pdf/2409.19038.pdfPerguntas Mais Profundas