CLIPは一般的なクエリには強いが、微細な物体特徴の識別には限界がある。この問題の根本原因は、CLIPの潜在空間における物体特徴の分離性の低さにある。
オープンボキャブラリオブジェクト検出のためのセルフトレーニングにおける2つの課題(ノイズの多い疑似ラベルと疑似ラベルの分布の頻繁な変化)に対処するため、2つの解決策(SAFヘッドと定期的な更新)を提案する。