Core Concepts
LlamaFactory는 다양한 효율적인 미세 조정 기법을 통합하여 100개 이상의 언어 모델을 유연하게 미세 조정할 수 있는 통합 프레임워크이다.
Abstract
LlamaFactory는 언어 모델(LLM)을 효율적으로 미세 조정하기 위한 통합 프레임워크이다. 이 프레임워크는 모델 로더, 데이터 워커, 트레이너의 3가지 주요 모듈로 구성되어 있다.
모델 로더 모듈은 100개 이상의 LLM을 지원하며, 모델 초기화, 패치, 양자화, 어댑터 부착 등의 기능을 제공한다. 데이터 워커 모듈은 다양한 형식의 데이터셋을 통일된 구조로 처리하고 병합하는 기능을 제공한다. 트레이너 모듈은 효율적인 미세 조정 기법(freeze-tuning, GaLore, LoRA, QLoRA 등)을 통합하여 LLM을 다양한 작업에 적용할 수 있게 한다.
LlamaFactory는 또한 LLAMABOARD라는 웹 기반 UI를 제공하여 사용자가 코딩 없이도 LLM을 미세 조정하고 평가할 수 있도록 지원한다. 실험 결과, LlamaFactory를 통해 LLM의 메모리 사용량, 처리량, 퍼플렉서티 등이 크게 향상되었다. 또한 다양한 텍스트 생성 작업에서도 우수한 성능을 보였다.
Stats
메모리 사용량이 18바이트/파라미터에서 0.6바이트/파라미터로 감소
Llama2-13B 모델의 경우 full-tuning 시 메모리 오버플로우가 발생했지만, QLoRA 기법을 사용하면 12.61GB의 메모리로 학습 가능
Quotes
"LlamaFactory는 100개 이상의 LLM을 유연하게 미세 조정할 수 있는 통합 프레임워크이다."
"LlamaFactory는 효율적인 미세 조정 기법을 통합하여 LLM의 메모리 사용량, 처리량, 퍼플렉서티 등을 크게 향상시켰다."