本文探討了基於半非平衡最優傳輸(SUOT)的重心計算方法,特別是在高斯分佈上的應用。傳統的 Wasserstein 重心計算方法在處理包含噪聲和異常值的真實數據時容易受到影響。為了解決這個問題,本文提出使用 SUOT 距離來衡量重心和其他分佈之間的距離。
SUOT 距離是通過放鬆其中一個邊緣約束,並使用 Kullback-Leibler 散度進行調節,從而實現對異常值的魯棒性。本文證明了在高斯分佈的情況下,SUOT 距離具有閉式解,並推導了兩種計算魯棒重心的方法:
本文從理論上證明了基於 SUOT 的重心保持高斯形式,並提供了兩種算法的收斂性保證。特別是,精確測地線梯度下降算法實現了與維度無關的收斂速度。
通過數值實驗,本文驗證了 SUOT 方法在存在異常值的情況下比傳統的 Wasserstein 距離方法更具魯棒性。具體而言,實驗結果表明,SUOT 重心受噪聲的影響較小,並且與兩個原始高斯的重心更接近。
此外,本文還進行了優化方法的比較研究,比較了梯度下降(GD)和隨機梯度下降(SGD)在 Bures 流形上的收斂性。實驗結果表明,本文提出的兩種方法(混合梯度下降和精確測地線梯度下降)在各種步長下都能找到下降方向並快速收斂到解。
本文提出了一種基於 SUOT 的魯棒重心計算方法,並證明了該方法在高斯分佈上的有效性和魯棒性。該方法為處理包含噪聲和異常值的真實數據提供了一種新的思路,並具有廣泛的應用前景。
翻譯成其他語言
從原文內容
arxiv.org
深入探究