이 논문은 에이전트의 행동을 설명하기 위한 의도 인식 정책 그래프 방법론을 제안한다.
먼저 에이전트 행동 설명의 중요성과 기존 방법론의 한계를 설명한다. 특히 에이전트의 내부 구조를 알 수 없는 경우 설명이 어려운 문제를 지적한다.
이를 해결하기 위해 정책 그래프(Policy Graph) 기반 방법론을 제안한다. 정책 그래프는 에이전트의 행동 정책과 환경 반응을 학습하여 모델링한다. 이를 통해 에이전트의 행동을 설명할 수 있다.
논문에서는 정책 그래프 구축을 위한 구체적인 워크플로우를 제안한다. 먼저 에이전트의 부분적 관찰 데이터를 수집한다. 그 다음 사용자가 이해할 수 있는 방식으로 상태를 이산화하는 코드를 작성한다.
이후 사용자가 에이전트의 바람직한 행동에 대한 가설(desires)을 제안하고, 이를 정책 그래프에 반영한다. 이를 통해 에이전트의 의도(intentions)를 추정할 수 있다.
마지막으로 이 방법론의 해석 가능성(interpretability)과 신뢰성(reliability)을 평가하는 지표를 제안한다. 사용자는 이 지표를 활용하여 정책 그래프 표현을 개선할 수 있다.
이 방법론을 통해 에이전트의 행동을 "무엇을", "어떻게", "왜"의 관점에서 설명할 수 있다. 이는 에이전트와의 협업, 감사, 제어 등 다양한 응용 분야에 활용될 수 있다.
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문