엉뚱한 질문으로 구성된 데이터셋을 활용한 대규모 언어 모델 미세 조정은 특정 과제에서는 성능 향상을 보이지만, 전반적인 성능 개선 효과는 미미하며, 오히려 특정 과제에서는 성능 저하를 초래할 수 있다.