Belangrijkste concepten
본 연구는 변압기 모델과 SHAP 설명 가능성 도구를 활용하여 금융 어휘 사전을 자동으로 생성하는 새로운 방법론인 eXplainable Lexicons (XLex)를 제안한다. XLex는 기존 전문가 구축 어휘 사전인 Loughran-McDonald (LM) 사전을 능가하는 성능을 보여준다.
Samenvatting
본 연구는 금융 분야의 감성 분석을 위해 변압기 모델과 SHAP 설명 가능성 도구를 활용하여 새로운 어휘 사전 생성 방법론인 XLex를 제안한다.
주요 내용은 다음과 같다:
- 변압기 기반 감성 분석 모델을 구축하고, SHAP을 활용하여 긍정 및 부정 단어를 추출한다.
- 추출된 단어들을 정제하고 중복을 제거하여 긍정 및 부정 단어 데이터셋을 생성한다.
- 긍정 및 부정 데이터셋을 병합하여 설명 가능한 어휘 사전 XLex를 생성한다.
- XLex를 기존 LM 어휘 사전과 결합하여 XLex+LM 통합 어휘 사전을 구축한다.
- 금융 데이터셋에 대한 실험 결과, XLex와 XLex+LM 모델이 LM 사전 대비 우수한 성능을 보인다.
Statistieken
금융 문서 감성 분석 실험에서 XLex 모델은 LM 사전 대비 분류 정확도가 0.431 향상되었다.
XLex+LM 통합 모델은 LM 대비 분류 정확도가 0.450 향상되었다.
Citaten
"변압기 기반 모델은 뛰어난 성능을 보이지만, 방대한 데이터와 계산 자원이 필요하며 실시간 환경에 적합하지 않다."
"어휘 사전 기반 방법은 구현이 간단하고 빠르지만, 전문가의 많은 수작업이 필요하다."