核心概念
인턴LM2는 혁신적인 사전 학습 및 최적화 기술을 통해 기존 대규모 언어 모델을 능가하는 성능을 달성했으며, 특히 장기 문맥 처리 능력이 뛰어나다.
摘要
이 보고서는 인턴LM2라는 새로운 대규모 언어 모델을 소개한다. 인턴LM2는 기존 모델들을 능가하는 성능을 보여주며, 특히 장기 문맥 처리 능력이 뛰어나다.
주요 내용은 다음과 같다:
- 데이터 준비: 텍스트, 코드, 장문 데이터 등 다양한 유형의 데이터를 체계적으로 준비하여 사전 학습에 활용했다.
- 사전 학습 과정: 4k 토큰 문맥에서 시작하여 32k 토큰 문맥으로 점진적으로 확장하는 방식으로 진행했다. 이를 통해 장기 문맥 처리 능력을 크게 향상시켰다.
- 정렬 과정: 감독 학습 미세 조정(SFT)과 새로운 COOL RLHF 기법을 활용하여 모델의 안전성과 유용성을 높였다.
- 평가 결과: 인턴LM2는 다양한 벤치마크에서 뛰어난 성능을 보였으며, 특히 장기 문맥 처리와 주관적 평가에서 탁월한 결과를 달성했다.
이 보고서는 인턴LM2의 개발 과정과 성능을 상세히 설명하고 있으며, 대규모 언어 모델 연구 분야에 많은 통찰력을 제공한다.
統計資料
인턴LM2는 총 2.0T ~ 2.6T 토큰을 사용하여 사전 학습되었다.
사전 학습 과정에서 4k 토큰 문맥 데이터와 32k 토큰 문맥 데이터를 활용했다.
추가적인 능력 향상을 위해 24B 토큰의 고품질 데이터셋을 사용하여 추가 학습을 진행했다.
引述
"인턴LM2는 혁신적인 사전 학습 및 최적화 기술을 통해 기존 대규모 언어 모델을 능가하는 성능을 달성했다."
"인턴LM2는 특히 장기 문맥 처리 능력이 뛰어나며, 200k 문맥에서 '바늘 찾기' 실험을 거의 완벽하게 수행했다."
"COOL RLHF 기법을 통해 인턴LM2는 다양한 인간의 선호도를 조화롭게 반영할 수 있게 되었다."