이 논문은 베트남어 다문서 요약 문제를 해결하기 위해 추출적 요약과 생성적 요약을 결합한 새로운 프레임워크 BERT-VBD를 제안한다.
추출적 요약 단계에서는 SBERT를 사용하여 문장 간 유사도를 계산하고 중요 문장을 선별한다. 생성적 요약 단계에서는 VBD-LLaMA2-7B-50b 모델을 활용하여 선별된 문장을 압축하고 새로운 문장으로 재구성한다.
이 두 단계를 결합함으로써 핵심 정보를 보존하면서도 읽기 쉬운 요약문을 생성할 수 있다. 실험 결과 BERT-VBD는 기존 모델들보다 우수한 성능을 보였다.
На другой язык
из исходного контента
arxiv.org
Дополнительные вопросы