Core Concepts
本論文では、k-疎なWassersteinバリセンターにおけるアウトライアの問題に対して、クラスタリングに基づくLPアルゴリズムを提案し、その理論的保証を示した。さらに、低次元空間での改善アルゴリズムを提案し、実験的にも有効性を示した。
Abstract
本論文では、k-疎なWassersteinバリセンターにおけるアウトライアの問題を扱っている。Wassersteinバリセンターは、一連の分布の平均を表す重要な最適化問題であり、実世界の多くの応用に活用されている。しかし、入力データにアウトライアが含まれる場合、既存のアルゴリズムでは対処できない。
本論文の主な貢献は以下の通り:
k-疎なWassersteinバリセンターにおけるアウトライアの問題とk-meansクラスタリングにおけるアウトライアの問題との関係を明らかにした。この関係を利用して、クラスタリングに基づくLPアルゴリズムを提案し、理論的な近似保証を示した。
低次元空間での改善アルゴリズムを提案した。このアルゴリズムは、コアセット技術を用いて、任意の小さな近似誤差を達成できる。さらに、この結果を一般的な距離空間にも拡張できることを示した。
合成データと実データを用いた実験を行い、提案手法の有効性を示した。特に、アウトライアを考慮することの重要性を実証した。
Stats
入力データの総重量は n であり、アウトライアの総重量は z である。
提案アルゴリズムの近似率は、(2 + √α)^2 および (2 + √β)^2 である。ここで、α と β はそれぞれk-meansクラスタリングとk-meansクラスタリングにおけるアウトライアの近似率を表す。
低次元空間での改善アルゴリズムの近似率は (1 + ϵ) である。