Core Concepts
多項式閾値関数を強汚染モデルの下で効率的に学習するアルゴリズムを提案する。アルゴリズムは、多項式の超非特異分解と局所化手法を組み合わせることで、従来の手法よりも大幅に良い誤り保証を達成する。
Abstract
本論文では、多項式閾値関数(PTF)を強汚染モデルの下で効率的に学習するアルゴリズムを提案する。強汚染モデルでは、データの一定割合が悪意のある攻撃者によって任意に改変される。
まず、多項式の構造を捉えるための新しい概念として「超非特異分解」を導入する。これは、多項式を少数の線形に近い多項式の組み合わせで近似的に表現するものである。超非特異分解は、ガウス分布下での良好な濃度・反濃度性質を持つ。
次に、この超非特異分解を用いて、PTFの低マージン領域を適切に分割する手法を示す。各分割領域では、ガウス分布の条件付き分布が良好な濃度・反濃度性質を持つ。
最後に、分割された領域ごとにロバストなパーセプトロンアルゴリズムを適用することで、強汚染モデルの下でPTFを効率的に学習できるアルゴリズムを提案する。このアルゴリズムは、従来の手法よりも大幅に良い誤り保証を達成する。
Stats
強汚染モデルでは、データの一定割合が悪意のある攻撃者によって任意に改変される。
提案アルゴリズムの誤り保証は、従来の手法よりも大幅に良い。具体的には、Oc,d(1) opt^(1-c) + ϵの誤り保証を達成する。ここで、cは任意の定数、optは汚染率、ϵは任意の小さな正の定数。
Quotes
"多項式閾値関数を強汚染モデルの下で効率的に学習するアルゴリズムを提案する。"
"アルゴリズムは、多項式の超非特異分解と局所化手法を組み合わせることで、従来の手法よりも大幅に良い誤り保証を達成する。"