이 논문은 클래스 불균형 반도체 학습(CISSL) 문제를 다룬다. CISSL 문제에서는 레이블된 데이터셋과 레이블되지 않은 데이터셋의 클래스 분포가 크게 다를 수 있다는 점이 중요하다.
제안하는 알고리즘인 CDMAD는 다음과 같은 핵심 아이디어를 가지고 있다:
CDMAD는 레이블된 데이터셋과 레이블되지 않은 데이터셋의 클래스 분포가 크게 다른 경우에도 효과적으로 작동한다. 이는 분류기의 편향 정도를 측정할 때 두 데이터셋의 클래스 분포를 암묵적으로 고려할 수 있기 때문이다.
다양한 벤치마크 데이터셋에 대한 실험 결과, CDMAD가 기존 CISSL 알고리즘들보다 우수한 성능을 보였다. 또한 정성적 분석과 ablation 연구를 통해 CDMAD의 각 구성 요소의 효과를 입증하였다.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Hyuck Lee,He... at arxiv.org 03-18-2024
https://arxiv.org/pdf/2403.10391.pdfDeeper Inquiries