Core Concepts
제한된 주석 예산 하에서 풍부한 비주석 데이터를 활용하여 병리조직학 이미지 분류 모델의 성능을 향상시키는 것이 핵심 아이디어입니다.
Abstract
이 연구는 병리조직학 이미지 분류 문제에서 주석 데이터가 매우 제한적인 상황을 다룹니다. 제안하는 MyriadAL 프레임워크는 다음과 같은 핵심 구성 요소를 포함합니다:
자기 지도 학습을 통해 비주석 데이터에서 특징 표현을 학습하고, 이를 기반으로 의사 레이블을 생성합니다.
의사 레이블을 활용하여 액티브 러닝 과정에서 쿼리 샘플을 선택하는 새로운 알고리즘을 제안합니다. 이는 기존 불확실성 기반 방법의 한계를 극복하고 더 다양한 샘플을 선택할 수 있습니다.
제한된 주석 예산 하에서 MyriadAL은 기존 방법 대비 높은 분류 정확도와 매크로 F1 점수를 달성합니다. 특히 10-shot 학습에서 기존 방법을 크게 능가합니다.
더 많은 주석 예산을 허용할 경우, MyriadAL은 전체 데이터셋을 사용한 완전 지도 학습 수준의 성능을 5% 주석으로도 달성할 수 있습니다.
이 연구는 병리조직학 분야에서 제한된 주석 예산 하에서 효율적인 모델 학습을 위한 새로운 벤치마크를 제시합니다.
Stats
병리조직학 이미지 분류 문제에서 1-shot, 5-shot, 10-shot 학습 시 MyriadAL의 테스트 정확도는 각각 48.7%, 77.9%, 87.1%입니다.
1-shot, 5-shot, 10-shot 학습 시 MyriadAL의 매크로 F1 점수는 각각 51.2%, 79.5%, 88.0%입니다.
5% 주석으로도 MyriadAL은 완전 지도 학습 수준의 95.9% 테스트 정확도를 달성할 수 있습니다.
Quotes
"제한된 주석 예산 하에서 풍부한 비주석 데이터를 효과적으로 활용하는 것이 핵심 아이디어입니다."
"MyriadAL은 기존 방법 대비 높은 분류 정확도와 매크로 F1 점수를 달성합니다. 특히 10-shot 학습에서 기존 방법을 크게 능가합니다."
"5% 주석으로도 MyriadAL은 완전 지도 학습 수준의 95.9% 테스트 정확도를 달성할 수 있습니다."