HLSTransform은 FPGA를 사용하여 Llama 2 모델의 에너지 효율적인 추론을 달성합니다. 이를 통해 CPU 및 GPU 대비 최대 12.75배 및 8.25배의 에너지 소비 감소와 최대 2.46배의 추론 속도 향상을 달성합니다.