이 논문은 보편적 계획이라는 개념을 소개한다. 보편적 계획은 장애물, 초기 상태, 목표 집합에 관계없이 모든 계획 문제를 해결할 수 있는 결정론적 행동 순서이다. 이러한 계획은 센서 피드백 없이 맹목적으로 적용된다. 따라서 강화 학습 맥락에서 순수한 탐색으로 간주될 수 있으며, 기본적인 메모리 요구 사항으로도 최적의 계획을 생성할 수 있음을 보여준다.
이 연구는 수론과 자동화 이론에 기반하여 이산 및 연속(운동) 계획에 대한 보편적 계획을 제공하고 그 (반)완전성을 증명한다. 이 개념은 시뮬레이션 연구를 통해 적용 및 설명되며, 향후 연구 방향이 제시된다.
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問