Core Concepts
在標註樣本有限的情況下,本文提出了一種名為主動式自我半監督學習 (AS3L) 的框架,透過利用自我監督預訓練的知識來引導半監督學習過程,從而提升模型效能。
Abstract
書目資訊
Wen, Z., Pizarro, O., & Williams, S. (2024). Active Self-Semi-Supervised Learning for Few Labeled Samples. Neurocomputing. Retrieved from arXiv:2203.04560v3 [cs.CV]
研究目標
本研究旨在解決在標註數據有限的情況下,如何有效地利用自我監督預訓練來提升半監督學習模型的效能。
方法
本研究提出了一種名為主動式自我半監督學習 (AS3L) 的框架,該框架主要包含以下步驟:
- 自我監督預訓練: 使用 SimSiam 方法對整個數據集進行自我監督預訓練,以獲得有價值的特徵表示。
- 主動標籤樣本選擇: 基於預訓練的特徵表示,採用聚類方法選擇最具代表性的樣本進行標註。
- 先驗偽標籤生成: 利用標註樣本,透過在預訓練特徵空間中進行標籤傳播,為未標註樣本生成先驗偽標籤。
- 先驗偽標籤引導的半監督學習: 將先驗偽標籤與模型預測結合,引導半監督學習過程,並透過切換機制逐步轉換為僅使用模型預測的偽標籤。
主要發現
- 在標註樣本數量有限的情況下,僅依靠自我監督預訓練的權重初始化並不能有效地將有價值的資訊傳遞給半監督模型。
- AS3L 框架可以有效地利用自我監督預訓練的知識,透過先驗偽標籤引導半監督學習過程,從而顯著提升模型效能。
- AS3L 框架在多個圖像分類數據集上,特別是在標註樣本極度有限的情況下,表現優於現有的半監督學習方法。
- 相較於僅使用自我監督預訓練初始化的方法,AS3L 框架可以顯著加快模型的收斂速度。
主要結論
AS3L 框架提供了一種有效的方法,可以將自我監督預訓練的知識遷移到半監督學習模型中,尤其是在標註數據有限的情況下,可以顯著提升模型效能和收斂速度。
研究意義
本研究為解決標註數據稀缺問題提供了一種新的思路,並為半監督學習領域的發展做出了貢獻。
局限與未來研究方向
- 本研究主要關注圖像分類任務,未來可以探討 AS3L 框架在其他機器學習任務中的應用。
- 未來可以進一步研究更有效的主動學習策略和先驗偽標籤生成方法,以進一步提升 AS3L 框架的效能。
Stats
在 CIFAR-10 數據集上,使用 10 個標註樣本時,AS3L 的準確率達到 83.80%,而僅使用自我監督預訓練初始化的 FlexMatch 方法的準確率僅為 59.13%。
在 CIFAR-100 數據集上,使用 200 個標註樣本時,AS3L 的準確率達到 48.40%,而僅使用自我監督預訓練初始化的 FlexMatch 方法的準確率僅為 36.58%。
在 ImageNet 數據集上,使用 0.2% 的標註樣本時,AS3L 結合 FixMatch-EMAN 方法的 Top-1 準確率達到 40.4%,而僅使用自我監督預訓練初始化的 FixMatch-EMAN 方法的 Top-1 準確率僅為 32.7%。
相較於僅使用自我監督預訓練初始化的 FlexMatch 方法,AS3L 框架在達到相同準確率的情況下,所需的訓練時間縮短了約 2/3。
Quotes
"Training deep models with limited annotations poses a significant challenge when applied to diverse practical domains."
"Employing semi-supervised learning alongside the self-supervised model offers the potential to enhance label efficiency."
"However, this approach faces a bottleneck in reducing the need for labels."
"We observed that the semi-supervised model disrupts valuable information from self-supervised learning when only limited labels are available."
"To address this issue, this paper proposes a simple yet effective framework, active self-semi-supervised learning (AS3L)."