이 논문은 공간-시간적으로 연속적인 문제를 새로운 환경에서 신속하게 적응할 수 있는 에이전트의 능력에 대해 다룹니다. 동물들은 인공 시스템을 능가하는 새로운 상황에 적응하는 능력을 보여줍니다.
저자들은 행동을 탐색 절차의 물리적 구현으로 보고, 인지 그래프를 통해 모든 가능한 행동을 효율적으로 열거할 수 있다고 제안합니다. 이는 연속 공간에서의 소진적 탐색이 실용적이지 않다는 일반적인 견해에 도전합니다.
저자들은 행동 실행과 그래프 변이 사이의 긴밀한 피드백 루프를 조절하여 암묵적으로 행동을 열거하는 알고리즘을 설명합니다. 이를 위해 Hebbian 학습과 새로운 고차원 조화 표현을 사용합니다.
행동을 탐색으로 프레이밍함으로써 실시간 행동 적응을 위한 수학적으로 단순하고 생물학적으로 타당한 모델을 제공합니다. 이 프레임워크는 발달 학습과 무감독 기술 습득에 도움이 될 수 있으며, 데이터가 부족한 복잡한 환경에서 자율 로봇이 숙련된 기술을 마스터할 수 있는 길을 열어줍니다.
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Alex Baransk... a las arxiv.org 10-03-2024
https://arxiv.org/pdf/2410.01349.pdfConsultas más profundas