核心概念
本文提出了一種名為 COOD 的新型零樣本多標籤異常檢測框架,利用預先訓練好的視覺語言模型,通過基於概念的標籤擴展策略和新的評分函數,有效地在複雜的多標籤設定中檢測異常樣本,無需大量重新訓練。
摘要
COOD: 基於概念的零樣本多標籤異常檢測方法
研究目標:
本研究旨在解決現有異常檢測方法在複雜多標籤設定中難以捕捉複雜語義關係和標籤共現性的問題,提出一個新的框架,無需大量重新訓練即可有效檢測異常樣本。
方法:
本研究提出了一個名為 COOD 的新型零樣本多標籤異常檢測框架,該框架利用預先訓練好的視覺語言模型(特別是 CLIP),並結合了基於概念的標籤擴展策略和新的評分函數。
- 概念生成:利用大型語言模型(LLM)將基礎標籤集擴展為正負概念集。正概念捕捉與已知類別密切相關的精細語義細節,而負概念則引入語義上與已知類別相距甚遠的特徵,以增強區分異常樣本的能力。
- 相似度和異常分數計算:計算輸入圖像與正負概念集以及基礎標籤集的相似度分數,形成一個用於評估圖像與已知分佈關係的穩健語義空間。基於這些相似度,計算一個異常分數,用於判斷圖像是否屬於異常分佈。
主要發現:
- COOD 在標準基準測試中表現出優於現有方法的性能,在多標籤異常檢測方面實現了最先進的結果。
- COOD 在 ResNet 和 ViT 架構上均表現出強大的異常檢測性能,證明了其在不同模型架構上的有效性和穩健性。
- COOD 作為一種零樣本方法,無需額外訓練或複雜的參數調整,因此效率高,計算開銷低。
主要結論:
COOD 為複雜多標籤場景中的異常檢測提供了一種高效且有效的零樣本解決方案,以最小的開銷實現了最先進的性能。
意義:
COOD 通過增強模型對未知數據的穩健性,為醫療保健、自動化系統和安全等應用程序中更安全、更可靠的性能提供了支持,減少了與新數據模式或不斷發展的數據模式相關的風險。
局限性和未來研究方向:
- COOD 的性能依賴於概念生成的質量和 CLIP 模型嵌入的穩健性。
- 未來的工作可以研究自適應概念生成方法和替代嵌入模型,以提高複雜多標籤環境中的異常檢測性能。
統計資料
COOD 在 VOC 和 COCO 數據集上實現了超過 95% 的平均 AUROC。
COOD 在 Pascal VOC 數據集上實現了 8.76% 的 FPR95 和 97.79% 的 AUROC。
COOD 在 COCO 數據集上實現了 95.07% 的 AUROC。