이 논문은 메모리 기반 대화 시스템의 성능을 평가하기 위한 새로운 벤치마크인 MemBench를 소개한다. MemBench는 인지 과학과 심리학 이론을 바탕으로 구축되었으며, 수동적 및 능동적 메모리 회상 메커니즘을 모두 고려한다.
MemBench는 두 가지 주요 작업으로 구성된다:
이를 위해 다양한 감정 상태와 상황 정보가 포함된 메모리 데이터셋을 구축했다. 또한 메모리 주입 능력, 감정 지원 기술, 친밀도 등 새로운 평가 지표를 제안했다.
실험 결과, 현존하는 최강의 언어 모델들도 메모리 회상 및 주입 능력에서 여전히 인간에 크게 못미치는 것으로 나타났다. 이는 현재 메모리 기반 대화 시스템의 한계를 보여준다. MemBench는 이 분야의 발전을 위한 유용한 벤치마크가 될 것으로 기대된다.
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Junqing He, ... lúc arxiv.org 09-24-2024
https://arxiv.org/pdf/2409.15240.pdfYêu cầu sâu hơn