Core Concepts
결측치 처리를 위한 새로운 방법과 고차원 데이터 및 불균형 데이터 문제를 해결하는 AI 기반 파산 예측 파이프라인을 제안한다.
Abstract
이 연구는 기업 파산 예측을 위한 파이프라인을 설계하는 것에 초점을 맞추고 있다. 주요 과제는 결측값 존재, 고차원 데이터, 심각한 클래스 불균형 데이터베이스이다.
결측치 처리를 위한 새로운 방법이 제안되었다. 이 방법은 특징 의미론과 신뢰할 수 있는 관측치를 활용하여 저차원 공간에서 결측치를 예측한다. 결측치 주변의 소수의 가장 신뢰할 수 있는 관측치를 사용하여 의미론적 그래뉼을 형성하고, 이 그래뉼 내에서 내부 그래뉼 예측을 수행한다. 이를 통해 전체 데이터베이스에 반복적으로 접근할 필요 없이 결측치를 효율적으로 처리할 수 있다.
이 결측치 처리 방법을 폴란드 기업 파산 데이터셋에 적용하여 검증하였다. 높은 결측률에도 효과적인 솔루션을 제공한다.
또한 고차원 데이터와 클래스 불균형 문제를 해결하는 AI 기반 파산 예측 파이프라인을 설계하였다. 특징 선택, 데이터 균형화, 다양한 분류기를 활용하여 파산 예측 성능을 향상시켰다.
Stats
2012년부터 2016년 사이 미국에서 평균 32,176건의 파산이 발생했다.
유럽 국가에서 매년 200,000개 이상의 기업이 파산한다.
Quotes
기업 파산은 금융 부문의 주요 과제이다.
결측값, 고차원 데이터, 심각한 클래스 불균형은 AI/ML 모델 배포를 어렵게 만드는 주요 문제이다.