Główne pojęcia
QLoRA는 메모리 사용을 줄이면서도 성능을 유지하기 위해 다음과 같은 혁신을 도입했습니다: (a) 정규 분포 가중치에 정보 이론적으로 최적인 새로운 데이터 유형인 4비트 NormalFloat (NF4), (b) 양자화 상수를 양자화하여 평균 메모리 사용량을 줄이는 이중 양자화, (c) 메모리 급증을 관리하기 위한 페이지 최적화기.
Streszczenie
QLoRA는 메모리 사용을 줄이면서도 성능을 유지하기 위한 혁신을 도입했습니다.
첫째, 4비트 NormalFloat (NF4)라는 새로운 데이터 유형을 사용했습니다. 이는 정규 분포 가중치에 정보 이론적으로 최적입니다.
둘째, 양자화 상수를 다시 양자화하는 이중 양자화 기법을 사용했습니다. 이를 통해 평균 메모리 사용량을 줄일 수 있었습니다.
셋째, 메모리 급증을 관리하기 위한 페이지 최적화기를 도입했습니다.
이러한 혁신을 통해 QLoRA는 단 24시간의 미세 조정으로 ChatGPT의 99.3% 수준의 성능을 달성했습니다. 또한 1,000개 이상의 모델을 미세 조정하여 지침 따르기와 채팅봇 성능에 대한 자세한 분석을 제공했습니다.
Statystyki
QLoRA는 단 24시간의 미세 조정으로 ChatGPT의 99.3% 수준의 성능을 달성했습니다.
QLoRA를 사용하여 1,000개 이상의 모델을 미세 조정했습니다.
Cytaty
"QLoRA introduces a number of innovations to save memory without sacrificing performance: (a) 4-bit NormalFloat (NF4), a new data type that is information theoretically optimal for normally distributed weights (b) double quantization to reduce the average memory footprint by quantizing the quantization constants, and (c) paged optimizers to manage memory spikes."