Core Concepts
Llama2 7B 가중치의 단순한 무손실 ~1.5:1 압축 알고리즘을 소개하고, 이를 확장하여 사용자 정의 가변 정밀도, 가변 범위, 압축 숫자 데이터 유형을 제안한다. 이를 위한 간단한 하드웨어 구현을 논의하고, 가중치 압축 및 공유를 활용한 토큰 팩토리 예시를 제시한다.
Abstract
이 논문은 Llama2 7B 가중치의 단순한 무손실 ~1.5:1 압축 알고리즘으로 시작합니다. Llama2 7B 가중치의 분포 특성을 활용하여 엔트로피 코딩을 통해 압축할 수 있음을 보여줍니다. 이 기본 개념을 확장하여 다양한 부동 소수점 숫자, 가변 크기 정수, posit 등 사용자 정의 가변 정밀도, 가변 범위 압축 숫자 데이터 유형을 제안합니다.
이를 위한 간단하고 빠른 하드웨어 구현을 논의합니다. 산술 부호화, 허프만 부호화, ANS 등의 엔트로피 코더를 비교하고, ANS 기반의 간단한 하드웨어 구현을 소개합니다. 이를 통해 기존 gzip, bzip2 보다 우수한 압축 성능과 효율적인 하드웨어 구현이 가능함을 보여줍니다.
마지막으로 가중치 압축 및 공유를 활용한 토큰 팩토리 예시를 제시합니다. 동일한 모델을 사용하는 다중 프로세서에서 가중치 로딩 인프라를 공유함으로써 대역폭 요구사항을 크게 줄일 수 있음을 설명합니다.
Stats
Llama2 7B 가중치 파일 크기: 13,214,154,752 바이트
제안된 단순 압축 방식으로 압축 후 파일 크기: 10,736,500,736 바이트 (원본 대비 ~81.25%)
이상적인 엔트로피 코더로 압축 시 예상 파일 크기: 8,735,136,345 바이트 (원본 대비 ~66.10%)
rANS 16비트 압축기로 압축 시 파일 크기: 8,738,459,578 바이트 (원본 대비 ~66.13%)
tANS 8비트 압축기로 압축 시 파일 크기: 8,826,478,939 바이트 (원본 대비 ~66.8%)
gzip -9 압축 시 파일 크기: 10,477,008,576 바이트 (원본 대비 ~79.29%)
bzip2 -9 압축 시 파일 크기: 9,168,474,552 바이트 (원본 대비 ~69.38%)
Quotes
"Llama2 7B 가중치의 분포 특성은 특히 압축에 적합하다."
"이 기본 개념을 확장하여 다양한 부동 소수점 숫자, 가변 크기 정수, posit 등 사용자 정의 가변 정밀도, 가변 범위 압축 숫자 데이터 유형을 제안한다."
"ANS 기반의 간단한 하드웨어 구현을 통해 기존 gzip, bzip2 보다 우수한 압축 성능과 효율적인 하드웨어 구현이 가능하다."