이 연구는 다중 인용문 생성을 위한 새로운 방법을 제안한다. 기존의 인용문 생성 기술은 단일 문장 인용문 생성에 초점을 맞추었지만, 실제 상황에서는 하나의 문단에 여러 논문을 인용하는 경우가 많다. 이를 해결하기 위해 저자들은 대규모 언어 모델(LLM)을 활용하여 다중 인용문 문장을 생성하는 방법을 제안한다.
저자들은 먼저 S2ORC 데이터셋을 활용하여 MCG-S2ORC라는 새로운 데이터셋을 구축했다. 이 데이터셋에는 단일 인용 논문에 대해 2-3개의 인용 논문이 포함되어 있다. 이후 LLaMA, Alpaca, Vicuna 등 3개의 LLM 모델을 fine-tuning하여 다중 인용문 생성 성능을 평가했다.
실험 결과, Vicuna 모델이 가장 우수한 성능을 보였다. 또한 저자들은 인용 논문의 초록, 서론, 결론에서 추출한 지식 그래프 관계를 프롬프트에 포함시켜 모델의 성능을 더욱 향상시켰다. 이를 통해 모델이 논문 간 관계를 더 잘 이해하고 문맥에 맞는 인용문을 생성할 수 있게 되었다.
이 연구는 대규모 언어 모델을 활용하여 다중 인용문 생성 문제를 해결하고자 했으며, 지식 그래프 정보를 활용하여 성능을 향상시켰다는 점에서 의의가 있다. 향후 연구에서는 지식 그래프를 더욱 활용하여 정확하고 일관성 있는 다중 인용문 생성 기술을 개발할 수 있을 것으로 기대된다.
To Another Language
from source content
arxiv.org
Önemli Bilgiler Şuradan Elde Edildi
by Avinash Anan... : arxiv.org 04-23-2024
https://arxiv.org/pdf/2404.13865.pdfDaha Derin Sorular