מושגי ליבה
Genex는 상상력으로 환경을 탐험하고 이를 통해 더 나은 의사 결정을 내릴 수 있도록 돕는 비디오 생성 모델입니다.
תקציר
Genex: 상상력 기반 탐색을 통한 강화된 의사 결정 모델
본 논문에서는 대규모 3D 환경을 상상력으로 탐험하고, 물리적 이동 없이도 상상을 통해 얻은 관찰 정보를 바탕으로 판단을 업데이트할 수 있는 새로운 비디오 생성 모델인 Genex(Generative World Explorer)를 소개합니다.
본 연구는 실제 환경에서 물리적 탐험 없이도 상상력을 통해 환경에 대한 정보를 얻고, 이를 바탕으로 더 나은 의사 결정을 내릴 수 있는 인공지능 에이전트를 개발하는 것을 목표로 합니다.
Genex 프레임워크: Genex는 에이전트의 현재 자기 중심적 시점에서 파노라마 이미지를 입력받아, 의도된 이동 방향을 행동 입력으로 통합하여 미래의 자기 중심적 관찰을 생성하는 비디오 생성 모델입니다.
구형 일관성 학습 (SCL): Genex는 구형 일관성 학습을 통해 360도 파노라마 이미지 생성 시 발생할 수 있는 가장자리 불일치 문제를 해결하고, 생성된 세계의 일관성을 유지합니다.
상상력 기반 신념 수정: Genex는 POMDP (Partially Observable Markov Decision Process) 프레임워크 내에서 상상력 기반 신념 수정을 통해 에이전트가 상상 속 탐험을 통해 얻은 정보를 바탕으로 자신의 신념을 수정하고, 더 많은 정보를 기반으로 행동할 수 있도록 합니다.