AlignBot은 가정용 로봇의 VLM 기반 맞춤형 작업 계획을 사용자 알림과 효과적으로 정렬하기 위한 새로운 프레임워크입니다. 가정 환경에서 사용자 알림과 작업 계획을 정렬하는 것은 알림의 양, 다양성 및 멀티모달 특성으로 인해 큰 어려움을 겪습니다. 이를 해결하기 위해 AlignBot은 미세 조정된 LLaVA-7B 모델을 사용하여 GPT-4o의 어댑터 역할을 수행합니다. 이 어댑터 모델은 개인화된 선호도, 교정 지침 및 상황별 지원과 같은 다양한 형태의 사용자 알림을 구조화된 지침 형식의 큐로 내재화하여 GPT-4o가 맞춤형 작업 계획을 생성할 수 있도록 합니다. 또한 AlignBot은 GPT-4o에 대한 프롬프트를 개선하기 위해 작업 관련 과거 성공 사례를 동적으로 검색하는 메커니즘을 통합하여 작업 계획 정확도를 높입니다. AlignBot의 효과를 검증하기 위해 실제 가정 환경을 모방한 실험 환경에서 실험을 수행했으며, 1,500개 이상의 항목으로 구성된 멀티모달 데이터셋을 사용했습니다. 결과는 AlignBot이 사용자 알림을 해석하고 정렬하는 능력 덕분에 기존 LLM 및 VLM 기반 계획 생성기보다 크게 향상된 성능을 보여줍니다.
Na inny język
z treści źródłowej
arxiv.org
Głębsze pytania