CodecLM은 언어 모델을 특정 하류 작업에 맞춰 정렬하기 위한 일반 프레임워크이다. 먼저 강력한 언어 모델을 사용하여 시드 명령어를 메타데이터(사용 사례, 필요 기술)로 인코딩한다. 이 메타데이터를 디코딩하여 맞춤형 명령어를 생성하고, Self-Rubrics와 Contrastive Filtering을 통해 효과적인 명령어-응답 쌍을 선별한다. 이렇게 생성된 데이터로 타겟 언어 모델을 정렬하여 다양한 벤치마크에서 최신 성능을 달성한다.
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Zifeng Wang,... a las arxiv.org 04-10-2024
https://arxiv.org/pdf/2404.05875.pdfConsultas más profundas