이 논문은 보험 데이터 분석에서 중요 변수 선택 후 해당 변수의 계수에 대한 신뢰구간 구축 방법론을 다룬다.
주요 내용은 다음과 같다:
보험 데이터 분석에서 중요 변수 선택이 중요한 이유를 설명한다. 모델 성능 향상, 계산 비용 감소, 모델 구조 단순화, 규제 기준 준수 등의 이점이 있다.
일반화선형모형(GLM) 및 Tweedie 분포를 소개하고, 이를 활용한 보험 데이터 모델링의 장점을 설명한다. Tweedie 분포는 보험 손실 데이터의 특성을 잘 반영할 수 있다.
페널티 회귀(lasso, ridge 등)를 통한 변수 선택 방법을 소개하고, 선택된 변수의 계수에 대한 신뢰구간 추정 방법론을 제시한다. 디바이어스 추정량, 부트스트랩 등의 기법을 활용한다.
포아송 회귀, 음이항 회귀, Tweedie 회귀 등의 시뮬레이션 실험을 통해 제안한 방법론의 성능을 검증한다. 실제 보험 데이터에도 적용하여 중요 변수의 계수 신뢰구간을 구축한다.
종합적으로 이 논문은 보험 데이터 분석에서 중요 변수 선택 후 해당 변수의 계수에 대한 신뢰구간을 효과적으로 구축하는 방법론을 제시하고 있다.
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문