本文提出了一種名為「有益標籤」的新型主動學習方法。傳統的主動學習方法依賴於人工標註來提高模型性能,但這種方法存在一些問題:1)人工標註成本高昂;2)有時人工標註的標籤可能不是最佳的,反而會限制模型性能。
為了解決這些問題,本文提出了「有益標籤」的概念。具體來說,該方法利用影響函數來估計每個樣本對模型性能的影響,並自動為其分配能夠最大化影響的標籤,稱為「有益標籤」。這樣不僅可以提高模型性能,而且還可以免去人工標註的成本。
實驗結果表明,與傳統主動學習方法相比,「有益標籤」在各種基準數據集上都表現出色,尤其在一些具有挑戰性的數據集上,「有益標籤」的優勢更加明顯。此外,本文還進行了深入探討,驗證了影響函數在估計新樣本影響方面的準確性,並將「有益標籤」拓展到了微調大型語言模型等其他應用場景,取得了良好的效果。
總之,「有益標籤」是一種創新性的主動學習方法,能夠自動選擇最有益的樣本並為其分配最佳標籤,從而提高模型性能,同時消除了人工標註的需求。這對於實際應用具有重要意義。
לשפה אחרת
מתוכן המקור
arxiv.org
תובנות מפתח מזוקקות מ:
by Wenxiao Xiao... ב- arxiv.org 10-01-2024
https://arxiv.org/pdf/2405.17627.pdfשאלות מעמיקות