핵심 개념
대화형 전문가 모델링을 통해 언어 모델의 추론 능력을 향상시키고 편향을 줄일 수 있다.
초록
이 논문은 입장 탐지 작업에서 대화형 전문가 모델링 방법인 DEEM을 제안한다. DEEM은 다음과 같은 단계로 구성된다:
훈련 데이터를 활용하여 다양한 전문가를 생성한다.
전문가의 출현 빈도와 응답 정확도를 기준으로 경험 많은 전문가를 선별한다.
새로운 문장에 대해 관련 전문가를 동적으로 검색하여 추론에 활용한다.
실험 결과, DEEM은 기존 방법들에 비해 일관적으로 우수한 성능을 보였다. 특히 다중 목표 입장 탐지 작업에서 큰 성능 향상을 보였다. 또한 DEEM은 언어 모델의 편향을 줄이는 데에도 효과적인 것으로 나타났다.
통계
다양한 전문가 중 72.70%가 0.05% 미만의 낮은 빈도로 나타났다.
전문가의 31.27%가 50% 미만의 낮은 정확도를 보였다.
인용구
"Considering that stance detection usually requires detailed background knowledge, the vanilla reasoning method may neglect the domain knowledge to make a professional and accurate analysis."
"Inspired by the wisdom of crowds in sociological theory (Minsky, 1988; Piaget, 2013), we intuitively propose designing multiple capable experts to collaborate in order to come up with a comprehensive stance prediction."