이 연구는 로봇에게 음성 지시를 제공하여 오프로드 내비게이션을 수행하는 방법을 조사한다. 음성을 텍스트로 변환하고 대형 언어 모델(LLM)을 사용하여 지시에서 랜드마크, 선호 지형, 부사를 추출한다. 이를 바탕으로 언어 기반 의미 분할 모델을 통해 지형 유형과 랜드마크를 감지하고, 이를 모델 예측 제어(MPC) 컨트롤러에 입력하여 로봇을 원하는 지형으로 안내한다.
실험 결과, 지시에 부사와 선호 지형을 포함하는 것이 성능 향상에 중요한 것으로 나타났다. 이를 통해 랜드마크 감지와 속도 조절을 통해 복잡한 지형에서 안정적인 내비게이션이 가능하다.
toiselle kielelle
lähdeaineistosta
arxiv.org
Tärkeimmät oivallukset
by Faraz Lotfi,... klo arxiv.org 04-04-2024
https://arxiv.org/pdf/2404.02294.pdfSyvällisempiä Kysymyksiä