核心概念
本文提出了一種基於對抗式多代理強化學習 (MARL) 的框架,用於訓練主動偵測未知虛假資料注入攻擊 (FDIA) 的方法,並證明了遷移學習可以結合離線訓練模型的先驗知識,提升 MARL 模型應對未知攻擊的效能。
摘要
研究目標
本研究旨在開發一種主動偵測未知虛假資料注入攻擊 (FDIA) 的方法,以提升智慧電網的安全性。
研究方法
本研究提出了一種基於對抗式多代理強化學習 (MARL) 的框架,用於訓練主動偵測 FDIA 的方法。該框架包含兩個代理:一個模擬攻擊者,負責生成各種 FDIA 策略;另一個模擬防禦者,負責偵測和定位 FDIA。通過對抗訓練,防禦者可以不斷學習應對攻擊者生成的新型 FDIA。此外,本研究還採用了遷移學習的方法,將離線訓練模型的先驗知識遷移到 MARL 模型中,以提升其應對未知攻擊的效能。
主要發現
- 在沒有先驗知識的情況下,基於 MARL 框架訓練的防禦者可以有效應對攻擊者持續生成的未知 FDIA。
- 遷移學習可以將離線訓練模型的先驗知識保留下來,並提升 MARL 模型在面對 MARL 訓練過程中未見過的 FDIA 時的效能。
主要結論
本研究提出的 MARL 框架可以有效提升智慧電網對抗 FDIA 的能力。通過對抗訓練和遷移學習,可以訓練出能夠主動偵測和防禦未知 FDIA 的模型。
研究意義
本研究為智慧電網安全防禦提供了新的思路和方法,有助於提升電網應對日益嚴峻的網路攻擊的能力。
研究限制與未來方向
- 本研究僅在模擬環境下進行了驗證,未來需要在真實電網環境下進行測試。
- 未來可以進一步研究如何提升 MARL 模型的訓練效率和泛化能力。
統計資料
MARL-D 在五次獨立模擬運行中,對抗 MARL-A 生成的攻擊的偵測準確率分別為 63%、65%、71%、71% 和 77%。
在第三次模擬運行中,離線防禦者對抗 MARL-A 攻擊的準確率下降至 36%。
在時間不變攻擊下,TF-MARL-D 對各個匯流排的偵測準確率與離線防禦者相當或更高。
在五次獨立模擬運行中,TF-MARL-D 對抗 TF-MARL-A 生成的攻擊的偵測準確率分別為 33%、39%、39%、42% 和 46%,相較於離線防禦者提升了 40% 到 225%。