核心概念
不同的修剪策略對GoogLeNet的性能和可解釋性有不同的影響。連接稀疏修剪在保持準確性的同時可以大幅壓縮模型。現有的可解釋性度量指標可能無法完全捕捉修剪後模型的可解釋性。
摘要
本研究探討了三種不同的修剪方法 - 無結構修剪、結構修剪和連接稀疏修剪 - 對GoogLeNet在ImageNet驗證集上的性能和可解釋性的影響。
性能方面:
- 連接稀疏修剪在保持準確性的同時可以大幅壓縮模型,甚至在某些情況下可以提高準確性。
- 迭代修剪比一次性修剪能更好地維持模型性能,但需要更多的計算成本。
可解釋性方面:
- 使用機械可解釋性得分(MIS)作為可解釋性的度量,發現修剪率與可解釋性之間沒有顯著相關性。
- 即使模型準確率極低,也可能獲得高MIS得分,表明MIS可能無法完全反映模型的真實可解釋性。
- 對於softmax層,MIS得分普遍較低,與預期不符,進一步暴露了現有可解釋性度量的局限性。
總的來說,本研究提出了更有效的修剪策略,同時也指出了現有可解釋性度量的局限性,為未來研究提供了基礎。
统计
在80%參數被修剪的情況下,修剪後的GoogLeNet在ImageNet驗證集上的準確率仍然高於未修剪的GoogLeNet。
連接稀疏修剪在保持準確性的同時可以大幅壓縮模型,甚至在某些情況下可以提高準確性。
引用
"連接稀疏修剪,在保持準確性的同時可以大幅壓縮模型,甚至在某些情況下可以提高準確性。"
"即使模型準確率極低,也可能獲得高MIS得分,表明MIS可能無法完全反映模型的真實可解釋性。"