이 논문은 대화형 언어 모델의 추론 능력을 향상시키는 방법을 제안한다. 대화형 언어 모델은 복잡한 질문을 단계별 추론 과정을 통해 해결할 수 있지만, 추론 과정에 오류가 발생할 수 있다. 이 문제를 해결하기 위해 저자들은 선별적 필터링 추론기(SelF-Reasoner)를 제안한다.
SelF-Reasoner는 다음 3가지 주요 구성 요소로 이루어져 있다:
실험 결과, SelF-Reasoner는 ScienceQA, ECQA, LastLetter 데이터셋에서 기존 방법들보다 우수한 성능을 보였다. 추론 사슬 분석을 통해 소규모 언어 모델이 추론 사슬을 생성할 때 겪는 어려움을 확인했다. 추론 사슬의 품질을 높이기 위한 방향성을 제시했다.
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Yexin Wu,Zhu... lúc arxiv.org 03-29-2024
https://arxiv.org/pdf/2403.19167.pdfYêu cầu sâu hơn