核心概念
提出一種攤銷主動學習方法,利用神經網路作為查詢政策,避免重複模型訓練和獲取函數優化,實現實時數據選擇和與耗時基準方法相當的學習性能。
摘要
本文提出了一種攤銷主動學習(AL)方法,其中新數據由事先訓練的神經網路(NN)提出,而無需進行實際的模型訓練和獲取函數優化。這對於模型訓練或獲取優化具有挑戰性的情況很有幫助。
具體來說,文章利用高斯過程(GP)作為函數先驗,構建了一個AL模擬器。然後,訓練一個AL政策NN,能夠從模擬中零樣本泛化到實際的非參數函數學習問題。這樣可以實現實時的數據選擇,並與耗時的基準方法相當的學習性能。
文章的主要貢獻包括:
- 提出一個無需實際數據即可訓練AL政策NN的流程。
- 提出了可微分的AL目標函數,用於NN政策的訓練。
- 在常見基準問題上進行了實驗分析,驗證了方法的有效性。
統計資料
在1D問題(正弦函數和航空客運數據集)中,使用1個初始數據點,查詢10次,最終得到11個數據點。
在2D問題(Branin函數、Simionescu函數和Townsend函數)中,使用1個初始數據點,查詢20次,最終得到21個數據點。
在LGBB 2D數據集上,使用1個初始數據點,查詢20次,最終得到21個數據點。