Core Concepts
이 연구는 생성 언어 모델의 출력 텍스트와 긴 입력 텍스트에 대한 문제를 해결하기 위해 MExGen이라는 일반적인 프레임워크를 제안합니다. 이를 통해 다양한 귀인 알고리즘을 사용하여 더 지역적으로 충실한 설명을 제공할 수 있습니다.
Abstract
이 연구는 생성 언어 모델에 대한 퍼터베이션 기반 입력 귀인 설명을 다룹니다. 생성 언어 모델의 출력이 텍스트이고 입력 텍스트가 길다는 두 가지 문제를 해결하기 위해 MExGen이라는 일반적인 프레임워크를 제안합니다.
출력 텍스트 문제 해결을 위해 스칼라라이저라는 개념을 도입하여 텍스트를 실수로 매핑합니다. 다양한 스칼라라이저를 조사하고 비교합니다.
긴 입력 문제 해결을 위해 세 가지 방법을 사용합니다:
문장, 구, 단어 등 다양한 수준의 언어 단위로 입력 텍스트를 분할
단위 수준을 점진적으로 세분화하는 다층적 귀인 방식
단위 수 대비 선형 복잡도의 귀인 알고리즘 사용
요약과 문맥 기반 질문 답변 과제에 대한 체계적인 자동 및 사용자 평가를 수행합니다. 결과는 MExGen이 기존 방법보다 더 지역적으로 충실한 설명을 제공할 수 있음을 보여줍니다.
Stats
"Beyoncé Knowles-Carter는 미국의 가수, 작곡가, 배우이다."
"Beyoncé Knowles-Carter는 휴스턴에서 태어나 자랐으며 1990년대 후반에 유명해졌다."