核心概念
提出一種新的類增量學習方法ESSENTIAL,通過測量樣本的累積熵來選擇最具代表性的樣本作為記憶庫的樣本,並利用細粒度語義擴展來增強模型對新舊類別的學習能力,同時採用餘弦分類器來緩解類別不平衡和長尾分佈帶來的分類偏差。
要約
本文提出了一種新的類增量學習方法ESSENTIAL,旨在解決生物醫學領域中有限樣本情況下的類增量學習問題。
首先,作者提出了一種名為Uncertainty Trajectory Analyzer (UTA)的動態記憶模塊,通過測量樣本的累積熵來選擇最具代表性的樣本作為記憶庫的樣本。這種方法可以有效地追蹤模型在訓練過程中對每個樣本的預測不確定性,並選擇最具挑戰性的樣本作為記憶庫的樣本,以幫助模型在增量學習過程中保留之前學習的知識。
其次,作者提出了一種Fine-Grained Semantic Expansion模塊,通過對每個類別進行更細粒度的語義擴展,增強了模型在特徵空間中對新舊類別的學習能力,緩解了由於新舊類別樣本數量差異導致的類別重疊問題。
最後,作者採用了餘弦分類器,有效地緩解了由於類別不平衡和長尾分佈導致的分類偏差問題。
在兩個生物醫學數據集PathMNIST和BloodMNIST上的實驗結果表明,ESSENTIAL方法在類增量學習的準確率上顯著優於現有的方法,最高可達53.54%的提升。
統計
在BloodMNIST數據集上,ESSENTIAL方法在最後一個會話的準確率為99.89%,而其他方法如SAVC、TEEN、Bidist、FSCIL、WaRP-CIFSL和GKEAL分別為98.95%、98.28%、93.66%、99.19%、98.39%和99.19%。
在PathMNIST數據集上,ESSENTIAL方法在最後一個會話的準確率為99.91%,而其他方法如SAVC、TEEN、Bidist、FSCIL、WaRP-CIFSL和GKEAL分別為98.92%、98.21%、93.58%、99.15%、98.34%和99.15%。
引用
"在真實的臨床環境中,數據分佈隨時間而變化,新的有限疾病病例不斷湧現。因此,類增量學習具有重大意義,即深度學習模型需要學習新的類別知識,同時保持對先前疾病的準確識別。"
"傳統的深度神經網絡在適應新數據時,通常會嚴重遺忘先前的知識,除非從頭開始訓練,這不僅耗時而且計算量大。"
"類別不平衡或長尾分佈可能導致模型偏差,使模型過度關注之前學習的類別,從而偏離新類別。"