本論文は、確率分布の最適化問題を解決するための新しい粒子ベースのアルゴリズムである「変分輸送」を提案している。
まず、確率分布の最適化問題は、確率分布上の汎関数を最小化する問題として定式化される。このような問題は、ベイズ推論、分布頑健最適化、生成的対抗ネットワークなど、機械学習の様々な分野で現れる。
従来の手法では、確率分布をパラメータ化して最適化を行うが、これには表現力の限界や非凸性の問題がある。そこで本論文では、ワッサーシュタイン距離に基づく勾配降下法を直接適用することを提案する。具体的には、目的関数が変分表現を持つ場合に着目し、変分問題の解を用いて粒子を更新することで、ワッサーシュタイン勾配降下法を近似的に実行する。
理論的には、目的関数が関数版のポリャック-ロジャシェフスキー条件を満たし、カーネル法を用いて勾配を推定する場合、変分輸送は大域的最適性と線形収束性を持つことが示される。すなわち、変分輸送は確率分布の最適化問題に対して、計算効率性と大域的最適性の両立を実現するアルゴリズムである。
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Zhuoran Yang... a las arxiv.org 04-02-2024
https://arxiv.org/pdf/2012.11554.pdfConsultas más profundas