本論文では、オンラインでの戦略的分類問題を扱う。各エージェントは自身の真の特徴ベクトルを操作して好ましいラベルを得ようとするが、操作には一定のコストがかかる。学習者は、エージェントの操作された特徴ベクトルにのみアクセスできる中で、真のラベルを正確に予測することを目指す。
まず、エージェントの操作モデルと学習者の予測モデルを定義する。エージェントは自身の特徴ベクトルを操作するかどうかを最適化問題として解き、操作コストが一定の閾値以下の場合に操作を行う。一方、学習者は特徴ベクトルに2∥y∥∗/cの補正を加えた分類器を使用することで、操作されたデータでも正しい予測ができるようにする。
次に、プロキシデータと呼ばれる特徴ベクトルの推定量を定義する。プロキシデータは、エージェントの操作後の特徴ベクトルと真のラベルから構築される。プロキシデータは、分離可能であることが重要な性質となる。
提案するアルゴリズムは3つあり、いずれもプロキシデータを利用する。アルゴリズム1は、オフラインで最大マージン分類器を求める。アルゴリズム2は、アルゴリズム1の近似版で、反復的な勾配更新により最大マージン分類器を近似する。アルゴリズム3は、Ahmadi et al. (2021)の戦略的パーセプトロンアルゴリズムの一般化版である。
理論的には、これらのアルゴリズムについて、誤り回数、操作回数、最大マージン分類器への収束性などの保証を示す。また、数値実験では、提案アルゴリズムが既存手法に比べて優れた性能を示すことを確認する。
Başka Bir Dile
kaynak içeriğinden
arxiv.org
Önemli Bilgiler Şuradan Elde Edildi
by Ling... : arxiv.org 03-28-2024
https://arxiv.org/pdf/2403.18176.pdfDaha Derin Sorular