Główne pojęcia
本論文では、連続確率空間におけるmin-max最適化問題に対して、証明可能な粒子ベース主双対アルゴリズム(PAPAL)を提案し、混合ナッシュ均衡(MNE)を近似的に求める。
Streszczenie
混合ナッシュ均衡のための証明可能な粒子ベース主双対アルゴリズム、PAPAL
本論文は、機械学習におけるゲーム理論、特にmin-max最適化問題における混合ナッシュ均衡(MNE)を求めるための新しいアルゴリズムを提案している。
min-max最適化問題は、ゲーム理論、機械学習、経済学など、多くの分野で重要な役割を果たしている。特に、敵対的生成ネットワーク(GAN)や敵対的トレーニングなどの機械学習における最近の進歩により、min-max最適化への関心が再燃している。しかし、一般的なmin-max問題は非凸非凹であることが多く、純粋なナッシュ均衡が存在する保証がないため、解決が困難である。
純粋なナッシュ均衡は戦略空間内の単一の点であるのに対し、MNEは戦略空間上の確率分布として定義される。MNEは、純粋なナッシュ均衡とは異なり、より一般的な条件下で存在することが保証されている。