Core Concepts
情報エントロピーの神経推定を活用することで、ラベル付きデータが少ない状況でも半教師あり画像分類の性能を向上させることができる。
Abstract
本論文では、半教師あり画像分類のための新しい手法「InfoMatch」を提案している。InfoMatchは、情報エントロピーの上限と下限を同時に最適化することで、ラベル付きデータが少ない状況でも高い分類精度を達成する。
具体的には以下の2つのアプローチを取っている:
上限の最適化:
ラベル付きデータに対しては、クロスエントロピー損失関数を用いて、予測確率分布を真の分布に近づける。
ラベル無しデータに対しては、弱データ増強による疑似ラベルと強データ増強の整合性を取ることで、上限を最小化する。さらにCutMixも活用し、より強力な特徴抽出を行う。
下限の最適化:
ラベル無しデータに対して、2つの強データ増強ビューの間の相互情報量を最大化することで、データ分布のエントロピーの下限を最大化する。
これらの2つのアプローチを組み合わせることで、ラベル付きデータが少ない状況でも高い分類精度を達成できる。
実験結果では、CIFAR-10/100、SVHN、STL-10などの半教師あり学習ベンチマークで、既存手法を大きく上回る性能を示している。特に、ラベル付きデータが極端に少ない場合でも、完全教師あり学習を上回る精度を達成している。
Stats
10個のラベル付きデータでCIFAR-10の平均トップ1エラー率が4.39%と、完全教師あり学習(4.62%)を上回っている。
40個のラベル付きデータでSTL-10の平均トップ1エラー率が9.86%と、既存手法(13.74%)を大幅に下回っている。
Quotes
"情報エントロピーの神経推定を活用することで、ラベル付きデータが少ない状況でも半教師あり画像分類の性能を向上させることができる。"
"InfoMatchは、情報エントロピーの上限と下限を同時に最適化することで、ラベル付きデータが少ない状況でも高い分類精度を達成する。"