Core Concepts
ラベル付きデータが少ない、オープンセット、ラベルノイズ、クラス分布の不均衡/不整合といった5つの一般的な現実世界のシナリオにおいて、提案手法のContrastive Credibility Propagation (CCP)は、教師あり学習のベースラインを確実に上回る性能を発揮する。
Abstract
本論文では、セミ教師あり学習(SSL)の信頼性を高めるためのアルゴリズムContrastive Credibility Propagation (CCP)を提案している。
まず、5つの一般的な現実世界のSSLデータシナリオを定義している:
- ラベル付きデータが少ない
- オープンセット
- ラベルノイズ
- ラベル付きデータとラベルなしデータのクラス分布の不均衡/不整合
提案手法のCCPは、これらのシナリオに対して教師あり学習のベースラインを確実に上回る性能を発揮する。CCPは、擬似ラベルの反復的な精製と、ラベルノイズに対する堅牢性を統合したアルゴリズムである。
CCPの主な特徴は以下の通り:
- 擬似ラベルの不確実性を表現する信頼性ベクトルの導入
- 離散的な正例ペアを必要としない一般化された対照的損失関数の提案
- 擬似ラベルの分布の発散を抑える部分サンプリング手法の提案
これらの特徴により、CCPは様々なデータシナリオにおいて安定して高い性能を発揮することができる。
Stats
ラベル付きデータが少ない場合、CIFAR-10では94.50%、CIFAR-100では90.45%の精度を達成した。
オープンセットの場合、CIFAR-10では90.23%、CIFAR-100では90.25%の精度を達成した。
ラベルノイズの場合、CIFAR-10では90.28%、CIFAR-100では90.25%の精度を達成した。
クラス分布の不均衡/不整合の場合、CIFAR-10では78.55%、CIFAR-100では69.60%の精度を達成した。
Quotes
"ラベル付きデータが少ない、オープンセット、ラベルノイズ、クラス分布の不均衡/不整合といった5つの一般的な現実世界のシナリオにおいて、提案手法のContrastive Credibility Propagation (CCP)は、教師あり学習のベースラインを確実に上回る性能を発揮する。"
"CCPは、擬似ラベルの反復的な精製と、ラベルノイズに対する堅牢性を統合したアルゴリズムである。"