核心概念
本文提出了一種名為 LADDER 的新方法,利用大型語言模型 (LLM) 的推理能力來識別和修正機器學習模型中的錯誤切片,無需依賴明確的屬性標註。
摘要
LADDER:以語言為導向的切片發現與錯誤修正
這篇研究論文介紹了一種名為 LADDER 的新方法,用於發現和修正預測模型中的系統性錯誤,又稱錯誤切片。不同於傳統依賴屬性聚類或分析的方法,LADDER 利用大型語言模型 (LLM) 的推理能力,透過分析複雜的錯誤模式並產生可測試的假設來解決問題。
本研究旨在開發一種名為 LADDER 的新方法,利用大型語言模型 (LLM) 的推理能力,自動發現和修正機器學習模型中的錯誤切片,並克服傳統基於屬性的方法的局限性。
LADDER 的運作流程如下:
將模型表示投影到與語言對齊的特徵空間: LADDER 並非直接將原始圖像投影到視覺語言表示 (VLR) 空間,而是投影模型的表示。這種方法確保 LADDER 專注於模型認為相關的語義屬性,為識別錯誤提供更準確的基礎。
檢索突顯模型錯誤的句子: 利用圖像描述或放射學報告的文本語料庫,LADDER 會檢索與投影圖像表示高度相似的句子,這些句子表示正確分類樣本中存在但在錯誤分類樣本中缺少的視覺屬性,從而導致模型錯誤。
透過 LLM 產生假設: LADDER 使用檢索到的句子呼叫 LLM,以制定可測試的假設,用於推理模型的錯誤。LLM 會產生一組假設,說明模型可能存在偏差的屬性,以及一組用於測試每個假設的句子。
發現錯誤切片: 針對每個假設,LADDER 會計算句子集合的平均嵌入,並計算每個圖像與該嵌入的相似性分數。然後,它會檢索相似性分數低於特定閾值的圖像,這些圖像可能構成錯誤切片。
無需標註即可修正錯誤: LADDER 僅透過微調模型的分類頭來修正錯誤。它會為每個假設建立一個群組平衡的資料集,其中包含符合和不符合假設的圖像,然後微調分類頭以減輕錯誤。