핵심 개념
LLM을 조정하여 사용자 지시를 따르고 형식 오류를 줄이는 새로운 방법론 소개
초록
LLM의 능력을 향상시켜 사용자 지시를 따르고 형식 오류를 줄이는 방법론 소개
SL 단계와 RL 단계를 통해 LLM을 조정하는 방법론 소개
실험 결과, 제안된 방법이 기존 LLM 기반 추천 시스템을 능가하고 사용자 지시를 따르는 능력을 향상시킴
Introduction
LLM의 우수한 일반 지능에 영감을 받아 추천 시스템에 적용하는 연구가 진행 중
LLM을 조정하여 추천 시스템의 사용자 지시를 따르고 형식 오류를 줄이는 방법론 소개
Methodology
SL 단계와 RL 단계를 통해 LLM을 조정하는 방법론 소개
다양한 제어 신호를 활용하여 LLM의 능력을 향상시키는 방법론 제시
Experiments
두 실제 데이터셋에서의 실험 결과를 통해 제안된 방법이 기존 방법들을 능가하는 것을 확인