Core Concepts
疑似ラベルの選択を必要としない新しい自己教師学習手法を提案し、ランドマーク検出タスクの性能を向上させる。
Abstract
本論文は、ランドマーク検出のための新しい半教師あり学習手法を提案している。従来の自己教師学習では、信頼できる疑似ラベルを選択する必要があったが、この手法では選択を必要としない。
具体的には以下の2つの重要な要素を導入している:
疑似プリトレーニング:
疑似ラベルを使ってモデルの初期化を行う。これにより、ノイズの多い疑似ラベルの影響を抑えつつ、良好な初期化を得ることができる。
収縮回帰:
回帰の粒度を徐々に細かくしていく手法。初めは粗い粒度で回帰を行い、徐々に細かくしていくことで、ノイズの多い疑似ラベルに頑健な学習を実現する。
これらの要素を組み合わせた提案手法「STLD」は、3つの顔ランドマーク検出データセットと1つの医療ランドマーク検出データセットで、従来手法を上回る性能を示した。特に、少ない教師データ(1.6%~5%)の条件下で顕著な性能向上が見られた。また、大量の無教師データを活用するオムニ学習設定でも優れた結果を得ている。
Stats
疑似ラベルの予測誤差は、真のラベルの周辺に分布している。
疑似ラベルの予測誤差が小さい場合、その勾配は真のラベルからのずれが大きい可能性がある。
Quotes
疑似ラベルの選択は自己教師学習に必須の要素ではない。
信頼できる情報を先に活用することが自己教師学習の成功への鍵となる。