Core Concepts
질문 주목 스팬 추출(QASE) 모듈을 통해 사전 훈련된 생성형 언어 모델의 정확성과 신뢰성을 향상시킬 수 있다.
Abstract
이 연구는 기계 독해 과제에서 생성형 언어 모델의 "out-of-control generation" 문제를 해결하기 위해 QASE 모듈을 제안한다. QASE 모듈은 사전 훈련된 생성형 언어 모델의 fine-tuning 과정에 통합되어, 모델의 성능을 크게 향상시킨다.
구체적으로:
QASE 모듈은 질문과 관련된 텍스트 스팬을 추출하여 생성형 모델의 출력을 안내한다. 이를 통해 생성된 답변의 정확성과 일관성이 크게 향상된다.
QASE 모듈은 추가적인 계산 비용 없이 성능 향상을 달성한다. 따라서 자원 제한적인 환경에서도 효과적으로 활용할 수 있다.
실험 결과, QASE 모듈이 통합된 모델은 다양한 기계 독해 데이터셋에서 SOTA 수준의 성능을 달성하거나 능가한다. 특히 GPT-4와 비교했을 때 큰 성능 향상을 보인다.
Stats
기계 독해 과제에서 QASE 모듈이 통합된 모델은 기존 모델 대비 최대 33.8%의 정확도 향상과 8.4%의 F1 점수 향상을 달성했다.
MultiSpanQA 데이터셋에서는 최대 1.6%의 EM F1 점수 향상과 3.3%의 Overlap F1 점수 향상을 보였다.
Quoref 데이터셋에서는 최대 19.2%의 정확도 향상과 16.0%의 F1 점수 향상을 달성했다.
Quotes
"QASE 모듈은 사전 훈련된 생성형 언어 모델의 성능을 크게 향상시키며, 이는 추가적인 계산 비용 없이 달성된다."
"QASE 모듈이 통합된 모델은 다양한 기계 독해 데이터셋에서 SOTA 수준의 성능을 달성하거나 능가한다."
"QASE 모듈은 생성된 답변의 정확성과 일관성을 크게 향상시킨다."