핵심 개념
本文提出了一種新的非侵入式系統故障預測技術,利用開發人員提供的有限信息和最少的原始日誌信息,同時保持數據的完全私密性。該技術開發了一個基於神經網絡的多類別分類器,使用人工生成的匿名數據集進行訓練和測試。此外,還使用多準則決策制定(MCDM)方案來優先考慮故障,以滿足業務需求。結果表明,在不同的參數配置下,該模型能夠高度準確地預測故障。該方法可以應用於任何分類問題,只要輸入特徵可以映射到二進制值,並且可以提供分類即服務。
초록
本文提出了一種新的非侵入式系統故障預測技術,主要包括以下幾個方面:
-
利用開發人員提供的有限信息和最少的原始日誌信息,同時保持數據的完全私密性。開發人員提供的信息包括:文本到事件的映射、導致故障的事件序列,以及每個故障的優先級。
-
開發了一個基於神經網絡的多類別分類器,使用人工生成的匿名數據集進行訓練和測試。人工數據集的生成包括:使用遺傳算法的步驟、模式重複和隨機採樣等方法。
-
使用多準則決策制定(MCDM)方案,如分析層次過程(AHP),來為每個故障分配權重,以滿足業務需求。
-
應用形狀保持濾波器,減少概率和權重向量的方差,以確保它們的乘積不被任何一個因素主導。
-
該方法可以應用於任何分類問題,只要輸入特徵可以映射到二進制值,並且可以提供分類即服務。
結果表明,在不同的參數配置下,該模型能夠高度準確地預測故障。該方法避免了對原始日誌進行挖掘,同時保持了數據的私密性。
통계
故障預測的準確性可以達到90%以上。
增加訓練數據集大小可以顯著提高預測性能。
增加每個故障中事件的數量也可以提高預測性能。
增加故障的數量會降低預測性能,但可以通過增加訓練數據集大小來解決。
增加事件在故障中的集中度會略微降低預測性能。
增加訓練的epoch數可以提高預測性能。
增加mini-batch大小可以降低訓練時間,但會略微降低預測性能。
增加softmax層的決策閾值可以提高預測性能。
增加神經網絡中隱藏層的數量可以提高預測性能。
增加學習率會嚴重降低預測性能。
인용구
"本文提出了一種新的非侵入式系統故障預測技術,利用開發人員提供的有限信息和最少的原始日誌信息,同時保持數據的完全私密性。"
"該技術開發了一個基於神經網絡的多類別分類器,使用人工生成的匿名數據集進行訓練和測試。"
"此外,還使用多準則決策制定(MCDM)方案來優先考慮故障,以滿足業務需求。"