UPCS 프레임워크는 편향을 최소화하고 다양한 차원의 인물 구축을 통해 신뢰할 수 있는 대화 생성을 가능하게 한다.
대화 생성을 위해 대규모 언어 모델을 활용하여 성격 기반 합성 대화 데이터셋 PSYDIAL을 구축하였다.
저자 언어 모델을 활용하여 소량의 대화 데이터로부터 고품질이면서도 다양한 대화 데이터를 생성할 수 있다.
본 연구는 LLM의 스타일 생성 능력을 향상시키기 위해 암송 보조 메모리 전략과 다중 과제 스타일 학습 전략을 제안한다.
지속적 학습 환경에서 대화 생성 모델의 성능 향상을 위해 Text-Mixup 데이터 증강과 Batch Nuclear-Norm Maximization 기법을 제안한다.
다중 소스 대화 지식 선택과 응답 생성을 평가하기 위한 높은 품질의 벤치마크인 Ms.WoW를 소개하고, 대화 지식 플러그 앤 플레이 도전 과제를 제시한다.