Concetti Chiave
대화 AI 시스템에서 모델의 출력에 대한 신뢰도 추정은 환각 및 과도한 의존을 줄이는 데 매우 중요합니다. 이 연구에서는 대화 상태 추적(DST)에 초점을 맞추어 다양한 신뢰도 추정 방법을 포괄적으로 탐구합니다.
Sintesi
이 연구는 대화 상태 추적(DST)을 위한 신뢰도 추정 방법을 포괄적으로 탐구합니다.
- 오픈 및 폐쇄 가중치 모델에 적용할 수 있는 4가지 신뢰도 추정 방법을 제안합니다:
- 소프트맥스 기반 점수
- 토큰 점수 기반 점수
- 언어화된 신뢰도 점수
- 이들의 조합
- 이러한 방법들의 성능을 ROC-AUC와 ECE 지표로 평가하여 신뢰도 점수의 보정 수준을 측정합니다.
- 또한 자체 탐침 메커니즘을 제안하여 신뢰도 점수의 보정 수준을 향상시킵니다.
- 오픈 가중치 모델을 대화 상태 추적 작업에 미세 조정하면 신뢰도 점수의 보정 수준이 향상됨을 보여줍니다.
Statistiche
대화 상태 추적 작업에서 미세 조정된 오픈 가중치 모델은 44.6%의 가장 높은 JGA(Joint Goal Accuracy)를 달성했습니다.
미세 조정된 오픈 가중치 모델의 신뢰도 점수 보정 수준은 ROC-AUC 0.725, ECE 0.018로 가장 우수했습니다.
Citazioni
"대화 AI 시스템에서 모델의 출력에 대한 신뢰도 추정은 환각 및 과도한 의존을 줄이는 데 매우 중요합니다."
"이 연구에서는 대화 상태 추적(DST)에 초점을 맞추어 다양한 신뢰도 추정 방법을 포괄적으로 탐구합니다."