대규모, 다양하고 고품질의 사전 학습 데이터는 기반 모델의 성능에 큰 영향을 미친다. 이를 위해 제안된 통합 데이터 처리 프레임워크는 다양한 수준의 데이터 처리 연산자와 데이터 분석 모듈을 제공하여, 사용자가 효율적으로 데이터 품질을 개선할 수 있도록 한다.