핵심 개념
소셜 네트워크 데이터를 활용하여 지역 인플레이션 동향을 분석하고 예상을 실시간 또는 약간의 지연으로 평가하는 방법을 제시함.
초록
인플레이션은 중요한 경제 지표 중 하나로, 소셜 네트워크 데이터를 활용하여 지역 인플레이션 동향을 분석하는 방법을 소개함.
인플레이션 예상에 대한 추가 정보를 제공하고, 머신러닝 모델을 사용하여 지역 인플레이션 프로세스를 분석함.
BERT 모델을 사용하여 텍스트 분류 작업을 수행하고, 다양한 머신러닝 알고리즘과 비교하여 결과를 제시함.
SHAP를 활용하여 모델 해석을 수행하고, 키워드의 인플레이션 관련성을 시각화함.
Introduction
인플레이션은 중요한 경제 지표로, 실시간 정보 수집의 중요성 강조.
중앙 은행의 통화 정책과 인플레이션 예상의 관계 설명.
Data Collection and Preparation
Omsk 지역의 VK 그룹에서 8,518,428개의 게시물 수집.
게시물을 인플레이션 동향에 따라 레이블링.
Methodology
BERT 모델을 사용하여 4가지 변형 모델 구축.
최적의 모델은 BERT-inflation-256로 선정됨.
Benchmark Models
로지스틱 회귀, 의사결정 트리 분류기, 랜덤 포레스트 분류기, 그래디언트 부스팅 분류기의 성능 비교.
BERT 모델이 기존 모델보다 우수한 결과를 보임.
Discussion
SHAP를 사용하여 모델 해석을 수행하고, 키워드의 인플레이션 관련성을 시각화함.
모델의 해석 가능성과 발전 가능한 방향에 대한 논의.
Main Results
BERT 모델이 기존 모델보다 우수한 결과를 보임.
SHAP를 통한 모델 해석 결과 시각화.
통계
"BERT-inflation-512" 모델의 Recall: 0.7027, Precision: 0.7268, F1-score: 0.7050
"BERT-inflation-256" 모델의 Recall: 0.7007, Precision: 0.7218, F1-score: 0.7030
인용구
"인플레이션은 중요한 경제 지표로, 소셜 네트워크 데이터를 활용하여 지역 인플레이션 동향을 분석하는 방법을 소개함."
"BERT 모델이 기존 모델보다 우수한 결과를 보임."