핵심 개념
다양한 리뷰 내용을 통합하여 일관성 있고 비중복적인 문서를 생성하는 것이 핵심 목표이다.
초록
이 연구는 다중 리뷰 문서를 입력으로 받아 핵심 내용을 통합하여 일관성 있고 비중복적인 문서를 생성하는 Fusion-in-Context (FiC) 작업을 소개한다.
기존 연구에서는 단일 문서 기반의 내용 통합 작업을 다루었지만, 이 연구에서는 다중 문서 환경으로 확장하였다. 이를 통해 반복적이거나 상충되는 정보를 다루는 과제의 복잡성을 해결하고자 한다.
연구진은 1,000개의 리뷰 데이터셋을 구축하였으며, 이를 활용하여 내용 충실도와 포괄성을 평가하는 자동화된 메트릭을 개발하였다. 또한 응집성과 중복성에 대한 수동 평가도 수행하였다.
다양한 베이스라인 모델을 실험한 결과, 핵심 내용을 잘 포착하지만 응집성과 중복성 측면에서 개선의 여지가 있음을 확인하였다. 이는 향후 FiC 작업을 위한 모델 개발의 기회를 제시한다.
통계
리뷰 데이터셋에는 평균 3.13개의 요약문이 포함되어 있다.
요약문 문장의 83.15%가 둘 이상의 리뷰에서 추출된 내용을 포함한다.
요약문 문장의 53.29%가 단일 리뷰 내에서 둘 이상의 문장에 걸쳐 있다.
인용구
"다중 문서 환경에서는 반복적이거나 상충되는 정보를 다루는 과제의 복잡성을 해결해야 한다."
"향후 FiC 작업을 위한 모델 개발의 기회를 제시한다."