다양한 유형의 오염된 데이터 샘플(오염된 샘플, 노이즈 레이블, 혼합)을 효과적으로 탐지하기 위해 다중 모달 대형 언어 모델의 강력한 크로스 모달 정렬 및 추론 능력을 활용한 범용 데이터 정화기 제안