מושגי ליבה
본 연구는 카멜리온 데이터 세트의 품질 문제를 해결하고 재처리된 데이터 세트를 사용하여 여러 인스턴스 학습(MIL) 모델을 평가하여 유방암 림프절 전이 진단을 위한 인공지능 개발을 위한 포괄적인 벤치마크를 제시합니다.
תקציר
유방암 섹션의 병리학적 림프절 전이에 대한 포괄적인 벤치마크를 향하여: 카멜리온 데이터 세트 재처리 및 MIL 모델 평가
본 연구는 유방암 림프절 전이 검출을 위한 딥러닝 모델 평가에 널리 사용되는 공개 데이터 세트인 카멜리온 시리즈의 품질 문제를 해결하고, 이를 기반으로 여러 인스턴스 학습(MIL) 방법의 성능을 재평가하는 것을 목표로 합니다.
데이터 세트 재처리
연구팀은 카멜리온-16과 카멜리온-17 데이터 세트에서 이미지 품질, 라벨링 오류, 픽셀 수준 주석의 부재 등의 문제를 확인했습니다. 이러한 문제를 해결하기 위해 다음과 같은 단계를 거쳐 데이터 세트를 재처리했습니다.
저품질 슬라이드 제거: 초점 흐림, 염색 불량, 치료 관련 아티팩트가 있는 슬라이드를 제거했습니다.
라벨 오류 수정: 슬라이드 수준 라벨의 오류를 수정하고 카멜리온-16 데이터 세트의 이진 분류 라벨을 4가지 분류 체계(음성, 미세 전이, 거대 전이, ITC)로 확장했습니다.
픽셀 수준 주석 보완: 기존 픽셀 수준 주석의 오류를 수정하고 주석이 없는 양성 슬라이드에 픽셀 수준 주석을 추가했습니다.
MIL 모델 평가
재처리된 데이터 세트(Camelyon+)를 사용하여 ResNet-50, VIT-S, PLIP, CONCH, UNI, Gigapath 등 6가지 특징 추출기와 ABMIL, TransMIL, CLAM 등 12가지 MIL 방법의 성능을 평가했습니다.