核心概念
群組分佈式健壯優化可以通過在群組層面調整損失權重來平衡不同類別的分類性能,從而抑制網路流量分類中的類別不平衡效應。
摘要
本文研究了網路流量分類中的類別不平衡問題。類別不平衡會導致最優決策邊界偏移,使得機器學習模型的性能下降。為了緩解這一效應,作者提出了一種基於群組分佈式健壯優化的策略。
具體來說,作者首先將類別聚集成不同的群組,然後動態調整不同群組的損失權重,以最小化加權損失。這種方法可以解釋為近似求解一個斯塔克伯格博弈,其中領導者調整群組權重以最大化性能,而跟隨者則優化模型參數以最小化加權損失。
作者在典型的網路流量分類基準數據集上進行了大量實驗,結果表明,該方法不僅可以抑制類別不平衡的負面影響,而且還可以提高整體的預測性能。
統計資料
類別不平衡會導致最優決策邊界偏移,使得機器學習模型的性能下降。
網路流量數據集通常存在大量的少數類別,這些少數類別佔整個數據集的比例很小。
現有的方法,如數據增強和代價敏感學習,在處理類別不平衡問題時仍存在一些局限性。
引述
"群組分佈式健壯優化可以通過在群組層面調整損失權重來平衡不同類別的分類性能,從而抑制網路流量分類中的類別不平衡效應。"
"作者提出的方法可以解釋為近似求解一個斯塔克伯格博弈,其中領導者調整群組權重以最大化性能,而跟隨者則優化模型參數以最小化加權損失。"