Core Concepts
ラベルノイズ学習において、確率的グラフィカルモデルを用いてデータセット内のノイズレートを推定し、それに基づいたサンプル選択手法を提案することで、ノイズに強いモデルの学習を実現する。
Abstract
本研究では、ラベルノイズ学習における新しい確率的グラフィカルモデルを提案している。このモデルは、訓練データ内のノイズレートを推定し、それに基づいたサンプル選択手法を導入することで、ノイズに強いモデルの学習を実現する。
具体的には以下の通り:
確率的グラフィカルモデルを用いて、訓練データ内のノイズレートを推定する。このモデルは、入力画像、真のラベル、観測されたノイズラベルの関係をモデル化している。
推定したノイズレートに基づいて、サンプル選択の割合を動的に調整するカリキュラムを導入する。これにより、過剰適合や過小適合を防ぐことができる。
提案手法を既存のノイズラベル学習手法(DivideMix、FINE、InstanceGMなど)に統合することで、精度の向上を実現する。
実験では、合成データセットCIFAR100や、実世界データセットred mini-ImageNet、Clothing1M、mini-WebVisionなどで提案手法の有効性を示している。ノイズレートの推定精度も良好で、既存手法と比べて精度が向上している。
Stats
訓練データ内のノイズレートは0.2、0.3、0.4、0.5であった。
提案手法によって推定されたノイズレートは、実際のノイズレートに近い値となった。
Quotes
"Deep learning faces a formidable challenge when handling noisy labels, as models tend to overfit samples affected by label noise."
"Such curriculum is sub-optimal since it does not consider the actual label noise rate in the training set."