المفاهيم الأساسية
本稿では、敵対者が分類器の能力を観察してデータを操作する、実装時攻撃における堅牢な分類器の学習問題を、悲観的な二段階最適化問題としてモデル化し、その効率的な解法を提案しています。
الملخص
敵対的機械学習における分類器学習
本稿は、敵対的機械学習における、実装時攻撃に対する堅牢な分類器の学習問題を取り扱った研究論文です。
本研究の目的は、敵対者が分類器の能力を観察し、分類を回避するようにデータを操作する状況下においても、正確な予測を行うことができる堅牢な分類器を学習するための、効果的なモデルと解法を提案することです。
敵対者によるデータ操作を、分類器の学習後の実装段階における攻撃としてモデル化しています。
敵対者の行動を、分類器の予測を回避するようにデータを生成する、確率的なプレイヤーとして表現しています。
この相互作用を、学習者をリーダー、敵対者をフォロワーとする、悲観的な二段階最適化問題として定式化しています。
従来のモデルでは、敵対者が最小限のコストで済む解を選択すると仮定していましたが、本研究ではこの仮定を緩和し、より現実的なモデルを提案しています。
提案モデルでは、敵対者はパラメータ化された分布からデータをサンプリングし、分類器を回避するように分布を最適化します。
特に、テキストベースのデータ(スパムメールなど)を表現する際に用いられるバイナリ bag-of-words ベクトルを考慮し、バイナリデータの分布の連続近似を構築しています。
この問題を解決するために、目的関数が二階連続微分可能であることを前提とした、扱いやすく効率的な解法を提案しています。