핵심 개념
대화형 AI 모델의 인지 왜곡 탐지 및 분류 성능을 향상시키기 위해 추출, 추론, 토론 단계로 구성된 ERD 프레임워크를 제안한다.
초록
이 논문은 대화형 AI 모델을 활용하여 사용자의 발화에서 인지 왜곡을 탐지하고 분류하는 ERD 프레임워크를 제안한다.
- 추출 단계: 사용자 발화에서 인지 왜곡과 관련된 부분을 추출한다.
- 추론 단계: 추출된 부분을 바탕으로 인지 왜곡 유형을 추론한다.
- 토론 단계: 다중 에이전트 간 토론을 통해 추론 결과를 검증하고 최종 결정을 내린다.
실험 결과, ERD 프레임워크는 기존 방법 대비 인지 왜곡 분류 F1 점수를 9% 이상 향상시키고, 인지 왜곡 탐지 특이도 점수를 25% 이상 개선하였다. 이는 과도한 인지 왜곡 진단을 방지하여 실제 임상에서의 활용도를 높일 수 있다.
통계
사용자 발화에서 인지 왜곡이 포함된 부분만 입력할 경우 인지 왜곡 분류 F1 점수가 15.28에서 24.40으로 향상되었다.