메모리 기반 대화 시스템의 성능을 다양한 메모리 회상 패러다임과 단계에 걸쳐 종합적으로 평가하는 새로운 벤치마크를 제안한다.
대화 시스템의 정확성과 사실성을 높이기 위해 검색 보조 생성(Retrieval Augmented Generation) 기술을 연구하고 발전시키는 것이 이 챌린지의 핵심 목표이다.
대화 AI 시스템에서 모델의 출력에 대한 신뢰도 추정은 환각 및 과도한 의존을 줄이는 데 매우 중요합니다. 이 연구에서는 대화 상태 추적(DST)에 초점을 맞추어 다양한 신뢰도 추정 방법을 포괄적으로 탐구합니다.
ClarQ-LLM은 과제 지향 대화에서 정보 요청 및 명확화 질문을 하는 대화 모델의 능력을 평가하기 위한 프레임워크이다.
사용자 피드백은 대화 시스템 평가에 중요한 영향을 미치며, 크라우드워커와 LLM의 평가에 차이를 가져온다.
다양하고 심도 있으며 통찰력 있는 지시를 생성하기 위해 실제 대화에서 추출한 고수준 지시 전략을 새로운 대화 시나리오에 적용한다.
Apollonion은 사용자 프로필을 활용하여 개인화된 대화 서비스를 제공하는 프레임워크입니다.
대화 참여자 간 언어적 동기화는 대화의 자연스러움과 성공에 기여하지만, 대부분의 대화 시스템에는 이를 위한 기능이 없다. 본 연구에서는 GPT-2 기반 종단 간 과업 지향 대화 시스템에서 공유 어휘 활용을 통해 언어적 동기화를 달성하는 방법을 제안한다.
대화 참여자의 주도권 정보를 활용하여 적절한 응답을 생성하는 모델을 제안한다. 제안된 모델은 주도권 정보를 별도의 접두사 매개변수로 분리하여 관리하며, 동적으로 주도권을 고려하여 응답을 생성한다.
Dial-MAE는 대화 문맥 임베딩을 사용하여 응답을 생성함으로써 대화 문맥과 응답 간의 특징 정렬을 달성하는 새로운 사후 학습 방법이다.