본 논문은 준지도 학습(SSL) 분야에서 데이터 불균형 문제를 다룬다. 대부분의 기존 SSL 방법은 균형 잡힌 데이터 분포를 가정하지만, 현실 세계에서는 이러한 가정이 성립하지 않는 경우가 많다. 클래스 불균형 준지도 학습(CISSL) 문제에서, 불균형한 가성 레이블로 인한 편향은 데이터 분포의 불균형으로 인해 더욱 악화될 수 있다.
기존 방법들은 주로 인스턴스 수준에서 재가중치 또는 재샘플링을 통해 이 문제를 해결하려 했지만, 편향된 백본 표현에 크게 의존하여 성능이 제한적이었다. 일부 방법은 특징 수준 조정을 수행했지만 원치 않는 노이즈를 도입할 수 있다.
본 논문에서는 더 균형 잡힌 특징 분포의 이점을 논의하고, 균형 특징 수준 대조 학습 방법(BaCon)을 제안한다. BaCon은 샘플의 표현을 균형 잡힌 방식으로 직접 정규화한다. 구체적으로, 클래스별 특징 중심점을 양의 앵커로 사용하고, 간단하지만 효과적인 메커니즘을 통해 음의 앵커를 선택한다. 또한 분포 관련 온도 조정을 활용하여 클래스별 대조 정도를 동적으로 제어한다.
실험 결과, BaCon은 다양한 설정에서 기존 최신 방법들을 능가하는 성능을 보였다. 특히 극단적인 불균형 정도에서도 BaCon이 더 강건한 성능을 보였다.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Qianhan Feng... at arxiv.org 03-21-2024
https://arxiv.org/pdf/2403.12986.pdfDeeper Inquiries