Core Concepts
최소한의 데이터로도 사실 일관성 평가 모델의 성능을 개선할 수 있다.
Abstract
이 논문은 사실 일관성 자동 평가 모델인 AlignScore의 한계를 분석하고, 개선된 모델 LIM-RA를 제안한다.
AlignScore는 많은 데이터셋을 활용하지만, 데이터 품질이 낮은 문제가 있다. 따라서 데이터 정제 과정을 거쳐 데이터 크기를 10%로 줄였지만 성능이 향상되었다.
AlignScore는 이름, 숫자 등의 변형에 취약하다. 이를 개선하기 위해 합성 데이터를 추가하여 강건성을 높였다.
실험 결과, LIM-RA는 기존 최고 성능 모델인 AlignScore를 뛰어넘어 4개의 벤치마크에서 새로운 최고 성능을 달성했다.
Stats
데이터셋 크기를 줄이면 오히려 성능이 향상될 수 있다.
데이터 정제와 합성 데이터 추가로 모델의 강건성을 높일 수 있다.
Quotes
"AlignScore는 많은 데이터셋을 활용하지만, 데이터 품질이 낮은 문제가 있다."
"AlignScore는 이름, 숫자 등의 변형에 취약하다."