Temel Kavramlar
NOLO는 사전 훈련된 객체 감지기 및 광류 모델을 활용하여 새로운 환경에서도 추가적인 미세 조정이나 재교육 없이 단일 문맥 비디오만 보고 탐색 작업을 수행할 수 있는 인공지능 에이전트를 훈련시키는 것을 목표로 합니다.
Özet
NOLO: Navigate Only Look Once 연구 논문 요약
Zhou, B., Zhang, Z., Wang, J., & Lu, Z. (2024). NOLO: Navigate Only Look Once. arXiv preprint arXiv:2408.01384v2.
본 연구는 에이전트가 새로운 환경에서 단일 문맥 비디오만 보고 탐색 작업을 수행할 수 있도록 하는 인-컨텍스트 학습 기반 비디오 탐색 정책 학습 방법을 제안합니다.