מושגי ליבה
본 논문에서는 기존 트랜스포머 모델의 MLP 레이어를 DWN(Differentiable Weightless Neural Network) 레이어로 대체하여 에너지 효율성을 높인 QuWeiT(준무게추 트랜스포머)를 제안합니다.
תקציר
QuWeiT: 에너지 효율적인 추론을 위한 준무게추 트랜스포머
본 연구 논문에서는 컴퓨터 비전 및 자연어 처리 작업에서 에너지 효율적인 추론을 위해 MLP 레이어를 DWN(Differentiable Weightless Neural Network) 레이어로 대체하는 새로운 트랜스포머 모델인 QuWeiT(준무게추 트랜스포머)를 소개합니다.
기존 트랜스포머 모델의 높은 계산량 및 에너지 소비 문제를 해결하고자 함.
트랜스포머 모델의 MLP 레이어를 DWN 레이어로 대체하여 에너지 효율성을 향상시키고자 함.
기존 트랜스포머 모델의 MLP 레이어를 DWN 레이어로 대체하여 QuWeiT 모델을 설계.
DWN 레이어는 Look-Up Table(LUT) 기반의 경량 신경망 구조를 활용하여 계산 복잡도를 줄임.
이미지 분류 작업(CIFAR-10, CIFAR-100 데이터셋)과 언어 모델링 작업(Shakespeare 데이터셋)을 통해 QuWeiT 모델의 성능을 평가.
FPGA 및 ASIC 환경에서 QuWeiT 모델의 에너지 효율성을 측정하고 기존 트랜스포머 모델과 비교.