핵심 개념
모델 생성 요약의 품질을 평가하기 위한 SiCF 점수는 대화 요약에서 불확실성 추정을 향상시키고 SSDS를 개선하는 데 효과적이다.
초록
SSDS는 모델 생성 요약의 품질을 평가하기 위한 SiCF 점수를 소개하고, 대화 요약에서 불확실성 추정을 개선한다.
SiCF 점수는 텍스트 수준, 단어 수준 및 문장 수준에서 생성된 요약의 품질을 측정한다.
SiCF 점수는 불확실성 추정을 향상시키고, SAMSUM, TODSUM 및 DIALOGSUM에서 ROUGE 및 BERTScore-F에서 +1-2%의 개선을 보여준다.
모든 데이터셋은 개인 식별 정보가 없으며, 연구는 각 데이터셋의 라이선스를 준수하여 진행된다.
미래 연구에서는 SiCF의 세 가지 구성 요소에 대한 대안적 접근 방법을 탐구해야 한다.
통계
SSDS 결과: SAMSUM 및 TODSUM에서 ROUGE-1, ROUGE-2, BERTScore-F
불확실성 추정 결과: SiCF 점수에 대한 BERTScore-F
인용구
"SiCF 점수는 불확실성 추정을 개선하는 데 효과적이다."
"SiCF 점수는 대화 요약에서 불확실성 추정을 향상시키고 SSDS를 개선하는 데 효과적이다."