Core Concepts
능동 추론 프레임워크에서 예측적 계획과 경험 기반 학습을 결합한 혼합 모델을 제안하여, 데이터 복잡성과 계산 복잡성의 균형을 이루는 효율적인 의사결정 방식을 제시한다.
Abstract
이 논문은 능동 추론 프레임워크에서 두 가지 의사결정 방식, 즉 예측적 계획(DPEFE)과 경험 기반 학습(CL) 방식을 비교 분석하고, 이를 결합한 혼합 모델을 제안한다.
먼저 DPEFE 방식은 미래 관측치의 기대 자유 에너지를 최소화하는 계획을 통해 의사결정을 수행한다. 반면 CL 방식은 상태-행동 매핑을 학습하여 의사결정을 내린다.
DPEFE 방식은 복잡한 환경에서 빠르게 최적 경로를 찾지만 계산 복잡도가 높다. 반면 CL 방식은 계산 복잡도가 낮지만 데이터가 많이 필요하다.
이에 저자들은 상태 의존적 편향 매개변수 β를 도입하여 두 방식을 혼합한 모델을 제안한다. 이 모델은 환경 변화에 적응할 수 있으며, 모델 매개변수 분석을 통해 의사결정 과정의 설명 가능성을 제공한다.
실험 결과, 혼합 모델은 복잡한 격자 세계 과제에서 우수한 성능을 보였다. 특히 계획 능력이 높은 에이전트가 더 빠르게 학습하는 것을 확인할 수 있었다. 이는 제안된 혼합 모델이 예측적 계획과 경험 기반 학습의 장점을 효과적으로 활용할 수 있음을 보여준다.
Stats
격자 세계 과제에서 최적 경로 길이는 47단계이지만, 무작위 행동을 취할 경우 약 9,000단계가 소요된다.
DPEFE 에이전트는 10회 이내에 격자 세계를 학습하여 최적 경로를 찾을 수 있었다.
CL 방식 에이전트는 DPEFE 에이전트보다 더 많은 경험이 필요했다.
Quotes
"능동 추론은 생물학적으로 타당한 프레임워크로 여겨지며, 다른 현대적 방법들과 비교하여 지능적 행동을 모델링하는 다른 접근법을 채택한다."
"DPEFE 알고리즘은 계획 시간 수평선(T)에 선형적으로 의존하는 계산 복잡도를 가지지만, CL 방식은 계획 과정이 없어 계산 복잡도가 낮다."