이 논문은 텍스트 데이터 스트림에서 개념 drift를 생성하기 위한 4가지 방법을 제안한다. 이를 통해 개념 drift가 있는 벤치마크 데이터셋을 생성할 수 있으며, 새로운 텍스트 스트림 분류기와 개념 drift 탐지기 평가에 활용할 수 있다.
대규모 언어 모델을 활용하여 텍스트 데이터에서 구조화된 분류 체계를 자동으로 생성하고, 이를 바탕으로 효율적이고 정확한 텍스트 분류 모델을 구축할 수 있다.