기존 텍스트 증강 방법들은 특징 공간 이동 문제로 인해 성능 저하가 발생하는 문제를 해결하기 위해, 사전 훈련된 언어 모델을 활용한 하이브리드 인스턴스 필터링 프레임워크를 제안한다.
대규모 언어 모델(LLM)의 자연어 이해 및 실행 능력을 활용하여 텍스트 데이터 증강을 수행할 수 있다. 그러나 증강 데이터의 품질은 제공된 증강 지침에 크게 의존하며, 다양한 하위 작업에 걸쳐 효과가 일관되지 않다. 이를 해결하기 위해 본 연구에서는 LLM을 활용하여 다양한 증강 지침을 자동으로 생성하고, 작업 특화 지침을 선별하는 새로운 솔루션인 Self-LLMDA를 제안한다.