Core Concepts
Yi 모델 패밀리는 데이터 품질과 모델 성능을 강조하는 다차원 능력을 보여줍니다.
Stats
"우리는 3.1조 토큰의 영어와 중국어 말뭉치를 구축했습니다."
"Yi-34B는 GPT-3.5와 유사한 벤치마크 점수를 달성했습니다."
"우리는 200K 컨텍스트 길이를 달성하기 위해 경량 지속적 사전 훈련을 시행했습니다."
Quotes
"우리는 데이터 품질을 강조하며 사전 훈련 데이터를 3.1조 토큰으로 구축했습니다."
"Yi-34B는 GPT-3.5와 유사한 벤치마크 점수를 달성했습니다."