이 연구는 추상적 텍스트 요약을 위한 시퀀스-투-시퀀스 모델의 성능 향상에 초점을 맞추고 있다. 주요 내용은 다음과 같다:
CNN/DailyMail 데이터셋을 활용하여 다양한 모델 실험을 수행했다. 기본 모델에 coverage 메커니즘을 적용하고, 트랜스포머 네트워크 모델을 사용하였다.
기존 최적화 알고리즘(SGD, Adam)에 더해 입자 군집 최적화(PSO), 고래 최적화 알고리즘(WOA), 개미 군집 최적화(ACO) 등 메타 휴리스틱 최적화 기법을 적용하여 모델 성능을 개선하고자 하였다.
ROUGE 평가 지표를 사용하여 모델 성능을 측정하였다. 실험 결과, 트랜스포머 네트워크에 PSO 알고리즘을 적용한 모델이 가장 우수한 성능을 보였다.
추가적으로 OOV 단어 처리, 개체명 인식 등의 기능을 모델에 포함시켜 추상적 텍스트 요약 성능을 높이고자 하였다.
Para Outro Idioma
do conteúdo original
arxiv.org
Principais Insights Extraídos De
by Aditya Saxen... às arxiv.org 03-26-2024
https://arxiv.org/pdf/2403.16247.pdfPerguntas Mais Profundas