COIG-CQIA는 중국어 NLP 커뮤니티에 고품질이자 사용자 상호작용에 잘 부합하는 지침 미세 조정 데이터를 제공하기 위해 개발되었다. 다양한 출처의 데이터(Q&A 커뮤니티, 백과사전, 시험 문제 등)를 수집하고 엄격한 정제 과정을 거쳐 구축되었다. 실험 결과, COIG-CQIA로 미세 조정된 모델은 지식 및 보안 벤치마크에서 우수한 성능을 보였다. 또한 데이터 출처와 혼합 비율이 모델 성능에 미치는 영향을 분석하여 중요한 통찰을 제공한다.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Yuelin Bai,X... at arxiv.org 03-28-2024
https://arxiv.org/pdf/2403.18058.pdfDeeper Inquiries