本文提出了一種在測試時利用被丟棄的激活來提高模型性能的方法。
首先,作者發現深度神經網絡中的下採樣層在測試時會丟棄一部分激活,這些被丟棄的激活可能包含有用的信息。
為了利用這些被丟棄的激活,作者提出了一種搜索和聚合的方法:
定義一個激活搜索空間,每個狀態對應於一個可以提取的激活圖。
在給定的計算預算內,使用一個學習的評分函數進行貪心搜索,找到最有前景的激活圖。
使用一個加權平均的注意力聚合模塊,將這些激活圖聚合起來得到最終的預測。
作者在ImageNet和Cityscapes/ADE20K數據集上進行了大量實驗,結果表明這種方法可以顯著提高圖像分類和語義分割的性能,並且可以與現有的測試時數據增強方法互補。
翻譯成其他語言
從原文內容
arxiv.org
深入探究