본 연구는 소비자 불만 내러티브에서 체계적인 비정상성을 탐지하기 위한 NLP 기반 절차를 제안한다.
먼저 분류 알고리즘을 사용하여 정당한 불만을 식별한다. 그러나 작고 빈번한 체계적 패턴의 비정상적인 불만에 대해서는 기술적 및 인적 한계로 인해 어려움이 있다.
따라서 분류 이후 단계에서 내러티브를 정량적 데이터로 변환하고, 체계적 비정상성 탐지 지수를 사용하여 분석한다.
내러티브의 단어 수, 할인된 달러 금액, VADER 감정 강도 등의 지표를 활용하여 입력-출력 시스템을 구축한다. 이를 통해 Cobb-Douglas 관계를 추정하고, 전달 함수를 도출한다.
이후 I-index와 B-index를 사용하여 체계적 비정상성을 탐지한다. 이 과정에서 TF-IDF와 TF-IDF-VADER 두 가지 특징 추출 방법을 비교한다.
결과적으로 TF-IDF-VADER 특징 추출 방법이 TF-IDF 방법보다 체계적 비정상성을 더 잘 탐지하는 것으로 나타났다.
To Another Language
from source content
arxiv.org
Viktige innsikter hentet fra
by Peih... klokken arxiv.org 03-28-2024
https://arxiv.org/pdf/2308.11138.pdfDypere Spørsmål