מושגי ליבה
추출적 요약 모델의 핵심 정보를 활용하여 추상적 요약 성능을 향상시키는 단일 인코더-디코더 프레임워크를 제안한다.
תקציר
이 논문은 추출적 요약과 추상적 요약을 통합하는 새로운 접근법인 EXTABS를 제안한다. 기존의 추출-추상 방식은 추출기와 추상기를 별도로 학습하여 추출된 핵심 정보를 추상기에 전달하는 방식이었다. 이는 오류 누적과 추가 학습 비용이 발생하는 문제가 있었다.
EXTABS는 단일 인코더-디코더 모델 내에서 추출기와 추상기를 통합하여 학습한다. 인코더는 텍스트 스팬 표현을 학습하고 핵심 정보를 추출하는 역할을 하며, 디코더는 인코더의 출력과 추출된 핵심 정보 마스크를 활용하여 요약문을 생성한다. 이를 통해 오류 누적 문제를 해결하고 추출과 추상 간 시너지 효과를 얻을 수 있다.
실험 결과, EXTABS는 CNN/DailyMail 데이터셋에서 추상적 요약 성능이 기존 모델을 능가하고, Reddit과 PubMed 데이터셋에서 추출적 요약 SOTA 성능을 달성하면서도 추상적 요약 성능을 유지하는 것으로 나타났다.
סטטיסטיקה
[NAME]은 [DATE] 기소 혐의가 보호관찰 형량의 일부로 말소되었다고 증언했다.
[NAME], [AGE]는 연방 정부를 상대로 한 경찰 부패 재판에서 증언하는 12명 이상의 전 마약 딜러 중 한 명이다.
[NAME]은 [COMPANY]에서 농구 코치 직을 잃었다.
ציטוטים
"[NAME]은 이번 주 마약 판매 경력에 대해 증언한 뒤 사립 아카데미의 정식 코치 직을 잃었다."
"[NAME], [AGE], 연방 정부를 상대로 한 경찰 부패 혐의에 대해 증언하는 12명 이상의 전 마약 딜러 중 한 명이다."
"[NAME]은 [DATE]에 농구 코치로 채용될 때 배경 조사를 통과했다고 [COMPANY] 관계자가 말했다."