Core Concepts
EXPLORER는 신경 모듈을 통한 탐험과 기호 모듈을 통한 활용을 결합하여 텍스트 강화 학습을 수행하는 신경-기호 에이전트이다.
Abstract
EXPLORER는 텍스트 기반 게임(TBG)을 위한 신경-기호 에이전트이다. TBG에서 에이전트는 자연어 이해와 추론을 결합해야 한다. 기존 접근법은 한계가 있는데, 순수 심층 강화 학습 기반 접근은 관찰된 객체에 대해서는 잘 작동하지만 관찰되지 않은 객체에 대해서는 성능이 떨어지고, 상식 기반 심층 강화 학습 에이전트는 정책이 해석 가능하지 않고 전이가 어렵다.
EXPLORER는 이러한 문제를 해결하기 위해 신경 모듈과 기호 모듈을 결합한다. 신경 모듈은 탐험을 담당하고 기호 모듈은 활용을 담당한다. 기호 모듈은 귀납적 논리 프로그래밍(ILP)을 사용하여 규칙을 학습하고, 이를 WordNet을 활용하여 일반화한다. 이를 통해 EXPLORER는 관찰되지 않은 객체에 대해서도 잘 작동한다.
실험 결과, EXPLORER는 TW-Cooking 및 TWC 게임에서 기존 모델을 능가하는 성능을 보였다. 또한 EXPLORER의 신경-기호 구조를 통해 정책에 대한 상세한 정성적 분석이 가능하다.
Stats
텍스트 기반 게임은 자연어 이해와 강화 학습을 결합해야 하는 과제이다.
순수 심층 강화 학습 기반 접근은 관찰된 객체에 대해서는 잘 작동하지만 관찰되지 않은 객체에 대해서는 성능이 떨어진다.
상식 기반 심층 강화 학습 에이전트는 정책이 해석 가능하지 않고 전이가 어렵다.
Quotes
"EXPLORER는 신경 모듈을 통한 탐험과 기호 모듈을 통한 활용을 결합하여 텍스트 강화 학습을 수행하는 신경-기호 에이전트이다."
"EXPLORER는 귀납적 논리 프로그래밍(ILP)을 사용하여 규칙을 학습하고, 이를 WordNet을 활용하여 일반화한다."