이 논문은 대규모 언어 모델의 내재된 지식을 효과적으로 활용하기 위한 새로운 지식 증강 프레임워크인 상상력 증강 생성(IAG)을 제안한다. IAG는 외부 자원에 의존하지 않고 언어 모델 자체의 상상력을 통해 지식을 증강한다.
구체적으로 IAG는 두 가지 상상 모듈을 포함한다:
또한 장문 문맥 증류 기법을 통해 교사 모델의 지식을 학생 모델에 전달한다.
실험 결과, IAG 기반의 IMcQA 모델은 기존 지식 증강 방법들과 비교하여 효율성과 성능 면에서 우수한 결과를 보였다. 특히 폐쇄형 및 개방형 질문 답변 과제에서 뛰어난 성능을 보였으며, 분포 외 일반화 능력도 우수했다.
לשפה אחרת
מתוכן המקור
arxiv.org
תובנות מפתח מזוקקות מ:
by Huanxuan Lia... ב- arxiv.org 03-25-2024
https://arxiv.org/pdf/2403.15268.pdfשאלות מעמיקות