핵심 개념
ML技術を用いたネットワーク侵入検知システムにおいて、予測の不確実性を適切に定量化することで、閉じた環境での高精度な分類性能と、未知の攻撃の検知を両立できる。
초록
本論文では、ネットワーク侵入検知システムにおけるML技術の信頼性向上について議論している。
まず、従来のML技術ベースのネットワーク侵入検知システムは、予測の不確実性を適切に考慮していないため、誤分類や未知の攻撃に対して過度に自信を持った予測を行う問題があることを指摘する。
そこで、3つの課題に取り組む:
- 閉じた環境での分類問題において、予測の不確実性を適切に定量化する
- 不確実性の定量化を活用したアクティブラーニングによる効率的なデータラベリング
- 未知の攻撃の検知を可能にする開放集合分類
具体的には、ベイズ型ニューラルネットワークなどの不確実性を適切に定量化できるモデルを提案・検討し、既存手法と比較評価を行う。その結果、提案手法が閉じた環境での分類性能と未知の攻撃検知の両立に優れていることを示す。
本研究は、安全性が重要なネットワーク侵入検知システムにおいて、不確実性の定量化が極めて重要であることを示しており、信頼性の高いMLモデルの構築に向けた指針を提供している。
통계
ベイジアンニューラルネットワークでは、予測分布のエントロピーを最大化することで、未知のサンプルに対して高い不確実性を示すことができる。
ランダムフォレストでは、各決定木の予測エントロピーの平均と、予測分布のエントロピーの差から、アレアトリックな不確実性とエピステミックな不確実性を分離して定量化できる。
인용구
未知のクラスに属するサンプルに対して、過度に自信を持った予測を行うことは、ネットワーク侵入検知システムにとって深刻な問題である。
ネットワーク侵入検知システムにおいては、予測の不確実性を適切に定量化し、それに基づいて適切な対応を取ることが重要である。