이 논문은 선별적 설명 생성 문제를 다룬다. 선별적 설명 생성은 신경망 모델의 예측 결과를 설명하기 위해 입력 데이터의 작은 부분집합(설명)을 식별하는 것이다. 기존 방법들은 데이터 내 단축키를 활용하여 설명을 생성하는 문제가 있었다.
이 논문에서는 Shortcuts-fused Selective Rationalization (SSR)이라는 새로운 방법을 제안한다. SSR은 다음과 같은 3가지 핵심 아이디어로 구성된다:
단축키 발견: 지도 학습 데이터에서 단축키 토큰을 식별하는 접근법을 제안한다.
단축키 활용 전략: 발견된 단축키 정보를 활용하여 예측 및 설명 생성 과정에서 단축키의 영향을 완화하는 두 가지 전략을 제안한다.
데이터 증강: 단축키 정보를 활용하여 무감독 학습 데이터의 크기를 늘리는 두 가지 데이터 증강 방법을 제안한다.
이러한 방법들을 통해 SSR은 기존 선별적 설명 생성 모델들보다 우수한 예측 성능과 설명 생성 성능을 보여준다.
Na inny język
z treści źródłowej
arxiv.org
Głębsze pytania