이 연구는 기업 파산 예측을 위한 파이프라인을 설계하는 것에 초점을 맞추고 있다. 주요 과제는 결측값 존재, 고차원 데이터, 심각한 클래스 불균형 데이터베이스이다.
결측치 처리를 위한 새로운 방법이 제안되었다. 이 방법은 특징 의미론과 신뢰할 수 있는 관측치를 활용하여 저차원 공간에서 결측치를 예측한다. 결측치 주변의 소수의 가장 신뢰할 수 있는 관측치를 사용하여 의미론적 그래뉼을 형성하고, 이 그래뉼 내에서 내부 그래뉼 예측을 수행한다. 이를 통해 전체 데이터베이스에 반복적으로 접근할 필요 없이 결측치를 효율적으로 처리할 수 있다.
이 결측치 처리 방법을 폴란드 기업 파산 데이터셋에 적용하여 검증하였다. 높은 결측률에도 효과적인 솔루션을 제공한다.
또한 고차원 데이터와 클래스 불균형 문제를 해결하는 AI 기반 파산 예측 파이프라인을 설계하였다. 특징 선택, 데이터 균형화, 다양한 분류기를 활용하여 파산 예측 성능을 향상시켰다.
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Debarati Cha... alle arxiv.org 04-02-2024
https://arxiv.org/pdf/2404.00013.pdfDomande più approfondite