핵심 개념
앙상블 다양성을 활용하여 자기 학습의 성능을 향상시키고 샘플 선택 편향에 대응하는 새로운 T-유사성 측정 방법을 제안합니다.
초록
자기 학습은 반지도 학습의 잘 알려진 접근 방식입니다.
소프트맥스 예측 확률 대신 앙상블의 예측 다양성을 기반으로 한 T-유사성이라는 새로운 신뢰도 측정 방법을 제안합니다.
실험적으로 제안된 방법이 다양한 분류 데이터셋에서 자기 라벨링 정책에 대한 성능 향상을 입증합니다.
Introduction
자기 학습은 반지도 학습의 강력한 접근 방식 중 하나입니다.
소프트맥스 예측 확률의 과신을 극복하기 위해 T-유사성이라는 새로운 신뢰도 측정 방법을 제안합니다.
Related Work
자기 학습은 라벨되지 않은 데이터를 학습 과정에 통합하는 전통적인 전략 중 하나입니다.
샘플 선택 편향은 데이터 라벨링이 특정 제약 조건에 따라 발생할 때 발생합니다.
Our Contributions
앙상블 다양성을 활용하여 자기 학습의 성능을 향상시키는 새로운 T-유사성 측정 방법을 제안합니다.
실험적으로 제안된 방법이 다양한 분류 데이터셋에서 자기 라벨링 정책에 대한 성능 향상을 입증합니다.
통계
소프트맥스 예측 확률은 과신을 보입니다.
T-유사성은 다양성을 기반으로 신뢰도를 측정합니다.
인용구
"소프트맥스 예측 확률은 과신을 일으키지만, T-유사성은 다양성을 통해 신뢰도를 높입니다."
"샘플 선택 편향은 데이터 라벨링에 제약을 가할 때 발생하며, 이를 극복하기 위해 T-유사성을 제안합니다."