대형 언어 모델을 무한 길이의 입력 텍스트에 효율적으로 적용할 수 있는 StreamingLLM 기술을 제안한다. 이를 통해 기존 모델의 성능 저하 없이 안정적이고 효율적인 언어 모델링을 가능하게 한다.