CodecLM은 언어 모델을 특정 하류 작업에 맞춰 정렬하기 위한 일반 프레임워크이다. 먼저 강력한 언어 모델을 사용하여 시드 명령어를 메타데이터(사용 사례, 필요 기술)로 인코딩한다. 이 메타데이터를 디코딩하여 맞춤형 명령어를 생성하고, Self-Rubrics와 Contrastive Filtering을 통해 효과적인 명령어-응답 쌍을 선별한다. 이렇게 생성된 데이터로 타겟 언어 모델을 정렬하여 다양한 벤치마크에서 최신 성능을 달성한다.
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Zifeng Wang,... lúc arxiv.org 04-10-2024
https://arxiv.org/pdf/2404.05875.pdfYêu cầu sâu hơn