Concetti Chiave
기존 텍스트 증강 방법들은 특징 공간 이동 문제로 인해 성능 저하가 발생하는 문제를 해결하기 위해, 사전 훈련된 언어 모델을 활용한 하이브리드 인스턴스 필터링 프레임워크를 제안한다.
Sintesi
이 연구는 기존 텍스트 증강 방법들이 특징 공간 이동 문제로 인해 성능 저하가 발생하는 문제를 해결하기 위해 제안되었다.
- 기존 방법들은 편집 기반 또는 사전 훈련된 언어 모델 기반 증강 방법을 사용하지만, 이로 인해 특징 공간이 이동되어 성능이 저하되는 문제가 발생한다.
- 이를 해결하기 위해 사전 훈련된 언어 모델을 활용한 하이브리드 인스턴스 필터링 프레임워크 BoostAug를 제안한다.
- BoostAug는 퍼플렉서티 필터링, 신뢰도 순위화, 예측 레이블 제약 등의 전략을 사용하여 특징 공간 이동을 최소화하고 기존 증강 방법의 성능을 향상시킨다.
- 실험 결과, BoostAug는 기존 증강 방법 대비 2-3%의 분류 정확도 향상을 보였다.
Statistiche
기존 증강 방법들은 일반적으로 ≈2%의 성능 저하를 보인다.
BoostAug는 기존 증강 방법 대비 2-3%의 분류 정확도 향상을 보였다.
Citazioni
"기존 텍스트 증강 방법들은 종종 특징 공간이 이동되어 대형 공개 데이터셋에서 성능이 저하되는 문제가 있다."
"BoostAug는 사전 훈련된 언어 모델을 활용하여 특징 공간 이동을 최소화하고 기존 증강 방법의 성능을 향상시킨다."