이 논문은 고에너지 물리학 분야를 위해 개발된 첫 번째 대규모 언어 모델인 Xiwu를 소개한다. Xiwu는 기반 모델의 유연성과 두 가지 학습 시스템을 특징으로 한다.
기반 모델의 유연성을 통해 Xiwu는 오픈소스 모델의 발전에 맞춰 진화할 수 있다. 전통적인 모델 학습 시스템을 통해 Xiwu는 고에너지 물리학 지식을 효과적으로 학습하고 "이해"할 수 있다. 또한 벡터 데이터베이스 기반의 즉시 학습 시스템을 통해 새로운 지식을 빠르게 학습하고, 동적으로 지식을 업데이트하며, 저비용으로 지식을 제거할 수 있다.
현재 Xiwu-13B는 Vicuna-13B에 비해 고에너지 물리학 도메인 Q&A 테스트에서 크게 우수한 성능을 보이며, ChatGPT-175B의 약 65% 수준의 성능을 달성했다. 또한 즉시 학습 시스템을 통해 여러 사용자가 협력하여 Xiwu를 가르칠 수 있음을 보여주었다. 개발한 시드 분열 기술은 다양한 분야에 적용될 수 있는 잠재력을 가지고 있다.
Egy másik nyelvre
a forrásanyagból
arxiv.org
Mélyebb kérdések