이 논문은 제로샷 스탠스 탐지(ZSSD) 문제를 다룬다. ZSSD는 훈련 데이터에 없는 새로운 대상에 대한 텍스트의 태도를 분류하는 것을 목표로 한다.
논문은 기존 데이터 증강 기법의 한계를 지적한다. 대상 증강 기법은 생성된 대상과 원본 텍스트 간의 논리적 연관성이 부족하고, 텍스트 증강 기법은 훈련 데이터에 의존적이어서 일반화가 부족하다.
이를 해결하기 위해 저자들은 인코더-디코더 데이터 증강(EDDA) 프레임워크를 제안한다. 인코더는 대규모 언어 모델과 체인 사고 프롬프팅을 사용하여 텍스트를 목표 특정 if-then 논거로 요약한다. 디코더는 의미 상관 단어 교체 전략을 통해 이러한 if-then 표현을 기반으로 새로운 샘플을 생성한다.
또한 저자들은 생성된 if-then 표현을 활용하는 논거 강화 네트워크(REN)를 제안한다. 실험 결과, EDDA 프레임워크가 기존 최신 기법들을 크게 능가하는 것을 확인했다.
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by Daijun Ding,... kl. arxiv.org 03-26-2024
https://arxiv.org/pdf/2403.15715.pdfDybere Forespørgsler