Kernkonzepte
생존 분석에서 블랙박스 기계 학습 모델의 투명성, 설명 가능성 및 공정성을 높이기 위해 다양한 해석 가능한 기계 학습 기법을 소개하고 적용한다.
Zusammenfassung
이 논문은 생존 분석에서 해석 가능한 기계 학습 기법에 대해 다룹니다.
생존 분석 개요:
생존 분석은 사건 발생 시간을 분석하는 통계 분야로, 사건 발생 시간과 검열 데이터를 고려합니다.
기존 통계 모델인 Cox 비례 위험 모델은 해석 가능성이 높지만 가정이 충족되지 않는 경우 문제가 발생할 수 있습니다.
기계 학습 모델은 예측 성능이 우수하지만 불투명성이 문제가 될 수 있습니다.
해석 가능한 기계 학습 기법:
국소적 방법: 개별 조건부 기대값(ICE) 곡선, 생존 카운터팩추얼 설명
전역적 방법: 부분 의존도 곡선, 누적 국소 효과, Friedman의 H-상호작용 통계량, 특징 중요도 측정 등
기존 기법의 생존 분석 적용 및 새로운 기법 소개
실제 데이터 적용 사례:
가나 5세 미만 아동 사망률 데이터를 활용한 다양한 해석 가능한 기법 적용
실제 데이터에서 모델 결정 및 예측을 이해하는 데 도움이 되는 방법 제시
Statistiken
"아동의 평균 생존 시간이 3개월 증가하면 사망률이 20% 감소한다."
"가나 5세 미만 아동의 사망률은 농촌 지역이 도시 지역보다 30% 높다."
Zitate
"생존 분석에서 블랙박스 기계 학습 모델의 투명성, 설명 가능성 및 공정성을 높이는 것이 중요하다."
"해석 가능한 기계 학습 기법은 생존 모델의 잠재적 편향과 한계를 밝혀내고 예측 또는 위험 요인에 영향을 미치는 특징을 이해하는 더 수학적으로 건전한 방법을 제공한다."