본 연구는 LLM 모듈, 지능형 감지 모듈, 강화학습 모듈로 구성된 LIM2N 프레임워크를 제안한다. LLM 모듈은 텍스트 또는 음성 입력을 받아 작업 유형과 환경 정보를 추출한다. 지능형 감지 모듈은 레이저 스캔, 스케치, LLM 모듈의 제약 정보를 통합하여 환경 정보를 생성한다. 강화학습 모듈은 작업 유형과 목적지 정보를 활용하여 로봇의 움직임을 결정한다.
실험 결과, LIM2N은 고정 장애물과 보행자가 있는 환경에서 우수한 내비게이션 성능을 보였다. 또한 사용자 연구를 통해 LIM2N이 언어와 스케치 입력을 통해 직관적이고 편리한 상호작용을 제공함을 확인했다.
Vers une autre langue
à partir du contenu source
arxiv.org
Questions plus approfondies