Core Concepts
LMFlow은 제한된 컴퓨팅 자원으로도 대규모 기반 모델을 효율적이고 효과적으로 특화 학습할 수 있는 확장 가능한 도구 키트입니다.
Abstract
이 논문은 LMFlow이라는 확장 가능하고 가벼운 도구 키트를 소개합니다. LMFlow은 일반 기반 모델을 전문 분야 및 작업 특화 모델로 미세 조정하는 것을 단순화하는 것을 목표로 합니다.
LMFlow은 다음과 같은 주요 기능을 제공합니다:
미세 조정 및 추론 가속화와 메모리 최적화
정렬 튜닝을 위한 RAFT 알고리즘 구현
긴 문맥 일반화 지원
모델 사용자 정의 기능 (어휘 확장 등)
멀티모달 학습 지원
LMFlow은 의료 분야에서 LLaMA 모델을 효과적으로 미세 조정하여 ChatGPT 수준의 성능을 달성했습니다. 또한 다양한 규모의 LLaMA 모델을 학습하여 공개하였습니다. LMFlow을 사용하면 누구나 자신만의 전문 언어 모델을 쉽게 학습할 수 있습니다.
Stats
LLaMA-33B 모델은 PubMedQA, MedMCQA 데이터셋에서 각각 74.0%, 50.2%의 성능을 달성했습니다.
의료 분야 LLaMA-7B, LLaMA-33B 모델은 각각 75.1%, 74.0%의 PubMedQA 성능을 보였습니다.
Quotes
"LMFlow은 제한된 컴퓨팅 자원으로도 대규모 기반 모델을 효율적이고 효과적으로 특화 학습할 수 있는 확장 가능한 도구 키트입니다."
"LMFlow을 사용하면 누구나 자신만의 전문 언어 모델을 쉽게 학습할 수 있습니다."