מושגי ליבה
의료 영상 분석 모델의 편향을 해결하고 다양한 인구 집단에 걸쳐 공정한 성능을 달성하기 위해, 인종, 건강 보험, 소득 등의 사회적 결정 요인을 고려한 교차적 접근이 필요하다.
תקציר
이 연구는 다중 레이블 흉부 X선 분류 작업에서 교차적 공정성을 달성하기 위한 방법론을 제안한다. 기존 연구들은 주로 단일 속성 기반의 공정성을 다루었지만, 이 연구는 인종, 건강 보험, 소득 등 다양한 사회적 결정 요인의 상호작용을 고려한다.
구체적으로, 사전 학습된 모델의 마지막 분류 층을 재학습할 때 교차적 집단 간 균형 데이터셋을 사용하고, 공정성 제약 조건을 추가하였다. 또한 다중 레이블 설정에서의 클래스 불균형 문제도 해결하였다.
MIMIC-CXR 데이터셋에 대한 실험 결과, 제안 방법이 기존 방법들에 비해 분류 성능과 공정성 지표 모두에서 우수한 성능을 보였다. 이를 통해 의료 영상 분석에서 다양한 인구 집단에 걸쳐 공정한 성능을 달성할 수 있음을 확인하였다.
סטטיסטיקה
전체 193,730개의 샘플이 8개의 교차적 집단으로 구성되어 있다.
저소득 및 저보험 가입 백인 집단: 20,638개 샘플
저소득 및 저보험 가입 비백인 집단: 10,650개 샘플
저소득 및 고보험 가입 백인 집단: 20,308개 샘플
저소득 및 고보험 가입 비백인 집단: 26,261개 샘플
고소득 및 저보험 가입 백인 집단: 50,499개 샘플
고소득 및 저보험 가입 비백인 집단: 9,666개 샘플
고소득 및 고보험 가입 백인 집단: 13,214개 샘플
고소득 및 고보험 가입 비백인 집단: 5,261개 샘플