본 연구는 LLM의 스타일화된 대화 생성 능력을 향상시키기 위해 다음과 같은 접근법을 제안한다:
통계적 및 언어학적 관점에서 38가지 스타일의 대화 데이터셋 StyleEval을 구축하였다. 이를 통해 LLM이 다양한 스타일을 학습할 수 있도록 하였다.
암송 보조 메모리 전략을 도입하여, LLM이 먼저 스타일 프로파일을 암송한 후 그에 맞는 대화를 생성하도록 하였다. 이를 통해 LLM이 스타일 관련 사고 과정을 학습할 수 있게 하였다.
다중 과제 스타일 학습을 통해 LLM의 전반적인 스타일 이해도를 높였다. 이는 스타일화된 대화 생성 뿐만 아니라 스타일 전이 과제에서도 효과적이었다.
실험 결과, 제안한 StyleChat 모델이 다양한 평가 지표에서 기존 모델들을 뛰어넘는 성능을 보였다. 특히 보지 못한 새로운 스타일에 대해서도 효과적으로 대응할 수 있었다. 이를 통해 LLM의 스타일 생성 능력을 크게 향상시킬 수 있었다.
翻譯成其他語言
從原文內容
arxiv.org
深入探究