핵심 개념
대화 시스템의 정확성과 사실성을 높이기 위해 검색 보조 생성(Retrieval Augmented Generation) 기술을 연구하고 발전시키는 것이 이 챌린지의 핵심 목표이다.
초록
이 챌린지는 대화 시스템의 검색 보조 생성(Retrieval Augmented Generation) 기술 발전을 위해 마련되었다. 실제 고객 서비스 대화 로그를 바탕으로 구축된 MobileCS2 데이터셋을 활용하여, 두 가지 트랙으로 구성된다:
트랙 1: 대화 맥락 및 지식베이스 기반 정보 검색
- 대화 맥락과 다양한 지식베이스(사용자 정보, 제품 정보, FAQ 등)를 활용하여 가장 관련성 높은 정보를 검색하는 모델을 개발한다.
트랙 2: 검색 보조 생성 대화 시스템
- 트랙 1에서 검색된 정보를 활용하여 사용자에게 정보적이고 일관성 있는 응답을 생성하는 대화 시스템을 개발한다.
제공된 베이스라인 모델 결과에 따르면, 두 트랙 모두 높은 성능을 달성하기 어려운 도전적인 과제임을 알 수 있다. 이를 통해 실제 고객 서비스 환경에서 활용 가능한 검색 보조 생성 대화 시스템을 개발하기 위한 연구가 필요함을 시사한다.
통계
대화 맥락과 관련된 지식베이스 정보를 정확하게 검색하는 것은 매우 어려운 과제이다. 베이스라인 모델의 recall@1, recall@5, recall@20 점수는 각각 0.225, 0.387, 0.573으로 나타났다.
검색된 지식베이스 정보를 활용하여 정보적이고 일관성 있는 응답을 생성하는 것 또한 쉽지 않다. 베이스라인 모델의 BLEU-4, BERTScore, Inform 점수는 각각 14.54, 0.639, 0.092로 나타났다.
인용구
"대화 시스템의 정확성과 사실성을 높이기 위해 검색 보조 생성 기술을 연구하고 발전시키는 것이 이 챌린지의 핵심 목표이다."
"실제 고객 서비스 환경에서 활용 가능한 검색 보조 생성 대화 시스템을 개발하기 위한 연구가 필요하다."