核心概念
提出一種名為SMLE的通用神經網絡架構,能夠有效地驗證和強制執行設計者選擇的性質,並提出一種基於投影梯度法的健壯訓練算法,在實際應用中具有良好的可擴展性和保證性。
摘要
本文提出了一種名為SMLE的通用神經網絡架構,旨在解決機器學習模型在安全關鍵或受監管情境中滿足特定性質的問題。SMLE架構通過在主幹網絡上添加一個可訓練的過度近似器,實現了高效的保守性質驗證。
作者還提出了一種基於投影梯度法的健壯訓練算法,該算法能夠保證在收斂時滿足所需的性質。該算法的計算成本只受模型複雜度的輕微影響,因此在實際應用中具有良好的可擴展性。
作者針對兩類實際重要的性質進行了具體實現:1)線性不等式定義的性質,涵蓋了風險評估、穩定時間序列預測、碰撞迴避等應用;2)多標籤分類中的互斥類別性質。實驗結果表明,該框架在保證性能的同時,也能提供滿足性質的全面保證,優於現有的預處理和後處理方法。
統計資料
對於隨機生成的線性性質,預處理方法的違反率超過50%,而SMLE能夠100%滿足性質。
在多標籤分類任務中,後處理方法的推理時間相比預處理方法慢213倍,而SMLE只慢2倍左右。