QLoRA는 메모리 사용을 줄이면서도 성능을 유지하기 위한 혁신을 도입했습니다.
첫째, 4비트 NormalFloat (NF4)라는 새로운 데이터 유형을 사용했습니다. 이는 정규 분포 가중치에 정보 이론적으로 최적입니다.
둘째, 양자화 상수를 다시 양자화하는 이중 양자화 기법을 사용했습니다. 이를 통해 평균 메모리 사용량을 줄일 수 있었습니다.
셋째, 메모리 급증을 관리하기 위한 페이지 최적화기를 도입했습니다.
이러한 혁신을 통해 QLoRA는 단 24시간의 미세 조정으로 ChatGPT의 99.3% 수준의 성능을 달성했습니다. 또한 1,000개 이상의 모델을 미세 조정하여 지침 따르기와 채팅봇 성능에 대한 자세한 분석을 제공했습니다.
Іншою мовою
із вихідного контенту
arxiv.org
Ключові висновки, отримані з
by Raymond Fok,... о arxiv.org 04-17-2024
https://arxiv.org/pdf/2310.07581.pdfГлибші Запити