핵심 개념
통신사 데이터를 활용하여 LightGBM 알고리즘 기반의 사용자 신용 평가 모델을 개발하고, 다양한 앙상블 학습 기법을 적용하여 최적의 신용 평가 모델을 구축하였다.
초록
이 연구는 통신사 사용자의 신용 평가를 위해 LightGBM 알고리즘과 다양한 앙상블 학습 기법을 활용하였다.
-
데이터 전처리 및 특징 엔지니어링:
- 통신사가 제공하는 방대한 사용자 데이터에서 핵심 특징을 추출하고, 통계적으로 유의미한 다차원 특징 집합을 구축하였다.
- 사용자의 소비 능력, 위치 궤적, 애플리케이션 사용 행태 등 4가지 데이터 세트로 구분하여 분석을 진행하였다.
-
기본 모델 구축:
- 선형 회귀, 의사결정 트리, 랜덤 포레스트, LightGBM 등 다양한 기계 학습 알고리즘을 활용하여 기본 모델을 구축하고 비교 분석하였다.
- LightGBM 모델이 다른 기본 모델에 비해 우수한 성능을 보였다.
-
앙상블 모델 구축:
- 기본 모델들의 장점을 결합하기 위해 Voting, Blending, Stacking 등의 앙상블 학습 기법을 적용하였다.
- LightGBM-Stacking 앙상블 모델이 가장 우수한 성능을 보였다.
이 연구는 통신사 사용자 신용 평가를 위해 LightGBM 알고리즘과 다양한 앙상블 학습 기법을 활용하여 정확도와 성능이 향상된 신용 평가 모델을 개발하였다. 이를 통해 통신사가 사용자 신용 관리와 의사 결정에 활용할 수 있는 기반을 마련하였다.
통계
통신사 사용자의 월 평균 통화 요금은 최근 6개월 동안 평균 CNY 36.1503이다.
통신사 사용자의 현재 월 계정 잔액은 평균 CNY 522.6124이다.
통신사 사용자의 최근 3개월 동안 월평균 쇼핑 횟수는 31.2057회이다.
인용구
"통신사는 사용자의 금융 행동뿐만 아니라 모바일 인터넷 사용 전반에 걸친 데이터를 확보하고 있어 사용자 신용 평가에 유리한 입장에 있다."
"LightGBM 알고리즘은 데이터 처리 효율성과 정확성이 높아 신용 평가 산업에서 점점 더 중요한 역할을 하고 있다."
"앙상블 학습 기법은 다양한 모델의 장점을 결합하여 더 나은 성능을 발휘할 수 있다."