Core Concepts
본 논문은 데이터 내 단축키를 발견하고 활용하여 선별적 설명 생성 성능을 향상시키는 방법을 제안한다.
Abstract
이 논문은 선별적 설명 생성 문제를 다룬다. 선별적 설명 생성은 신경망 모델의 예측 결과를 설명하기 위해 입력 데이터의 작은 부분집합(설명)을 식별하는 것이다. 기존 방법들은 데이터 내 단축키를 활용하여 설명을 생성하는 문제가 있었다.
이 논문에서는 Shortcuts-fused Selective Rationalization (SSR)이라는 새로운 방법을 제안한다. SSR은 다음과 같은 3가지 핵심 아이디어로 구성된다:
단축키 발견: 지도 학습 데이터에서 단축키 토큰을 식별하는 접근법을 제안한다.
단축키 활용 전략: 발견된 단축키 정보를 활용하여 예측 및 설명 생성 과정에서 단축키의 영향을 완화하는 두 가지 전략을 제안한다.
데이터 증강: 단축키 정보를 활용하여 무감독 학습 데이터의 크기를 늘리는 두 가지 데이터 증강 방법을 제안한다.
이러한 방법들을 통해 SSR은 기존 선별적 설명 생성 모델들보다 우수한 예측 성능과 설명 생성 성능을 보여준다.
Stats
영화 리뷰 데이터에서 "received a lukewarm response on review sites"는 단축키 토큰이다.
MultiRC 데이터에서 정답 설명의 56.2%가 모델이 예측한 설명에 포함되어 있다.
BoolQ 데이터에서 정답 설명의 51.9%가 모델이 예측한 설명에 포함되어 있다.
Quotes
"A well-trained unsupervised rationalization model inevitably composes rationales with both the gold rationale and shortcuts tokens."
"Since the real rationale label is explicitly introduced into the supervised rationalization, the "shortcuts" problem posed by unsupervised methods can be eased."