核心概念
대형 언어 모델(LLM)이 효과적인 질문을 통해 정보를 능동적으로 탐색하도록 유도하는 불확실성 인지 계획 알고리즘(UoT)을 소개합니다. UoT는 정보 이득에 기반한 불확실성 기반 보상을 활용하여 모델이 불확실성을 최대한 줄이는 방식으로 정보를 탐색하도록 유도합니다.
摘要
불확실성 인지 계획을 통한 대형 언어 모델의 정보 탐색 능력 향상
제목: 생각의 불확실성: 불확실성 인지 계획을 통한 대형 언어 모델의 정보 탐색 능력 향상
저자: Zhiyuan Hu, Chumin Liu, Xidong Feng, Yilun Zhao, See-Kiong Ng, Anh Tuan Luu, Junxian He, Pang Wei Koh, Bryan Hooi
본 연구는 대형 언어 모델(LLM)이 불확실성이 높은 상황에서도 효과적인 질문을 통해 정보를 능동적으로 탐색하여 작업 완료율을 향상시킬 수 있는 알고리즘을 제시하는 것을 목표로 합니다.