이 논문은 지속적 비전-언어 네비게이션(CVLN) 패러다임을 소개한다. CVLN은 비전-언어 네비게이션 에이전트가 새로운 환경에 순차적으로 적응하면서도 이전에 학습한 지식을 유지할 수 있도록 한다.
CVLN-I와 CVLN-D라는 두 가지 새로운 데이터셋을 제안했다. CVLN-I는 초기 지침을 기반으로 한 네비게이션, CVLN-D는 대화를 통해 정보를 얻는 네비게이션을 다룬다.
또한 Perplexity Replay(PerpR)와 Episodic Self-Replay(ESR)라는 두 가지 새로운 지속적 학습 방법을 제안했다. PerpR은 에피소드의 불확실성을 기반으로 리플레이 메모리를 관리하고, ESR은 이전 최적 행동을 재현하여 학습한다.
실험 결과, 제안한 방법들이 기존 지속적 학습 방법들보다 CVLN 과제에서 우수한 성능을 보였다. 이를 통해 비전-언어 네비게이션 에이전트의 지속적 학습 능력 향상을 확인할 수 있다.
Vers une autre langue
à partir du contenu source
arxiv.org
Questions plus approfondies