本文提出了一种称为"变换梯度投影(TGP)算法"的新算法框架,用于解决紧致矩阵流形上的优化问题。主要包含以下几个方面:
算法框架的概括性:TGP算法框架非常广泛,包含了经典的梯度投影算法作为特殊情况,并与基于重投影的线搜索算法相交。它是投影型线搜索算法的一个子类。
重要的特殊情况:对于问题(1)和提出的TGP算法框架,我们特别关注Stiefel流形或Grassmann流形。很明显,文献中的许多重要算法可以被视为Algorithm 1的特殊情况,并且它还引入了几个新的特殊情况。
投影的几何性质:我们证明了与对紧致矩阵流形M的投影相关的几个不等式,描述了投影前后距离和函数值的变化。这些结果对于后续研究TGP算法的收敛性质至关重要,并扩展了文献中关于重投影的某些不等式。
收敛性质:我们系统地探讨了TGP算法在各种步长下的收敛性质,包括Armijo、非单调Armijo和固定步长,并在假设A和假设B下建立了它们的弱收敛性、收敛速度和全局收敛性。当紧致矩阵流形是Stiefel流形或Grassmann流形时,我们导出的收敛结果要么包含,要么超越了文献中的结果。
实验效率:通过数值实验,我们发现,由于在搜索方向的选择上有更多选择,Algorithm 1在几个场景中可以取得优于基于重投影的线搜索算法和梯度投影算法的实验结果。
In eine andere Sprache
aus dem Quellinhalt
arxiv.org
Wichtige Erkenntnisse aus
by Wentao Ding,... um arxiv.org 05-01-2024
https://arxiv.org/pdf/2404.19392.pdfTiefere Fragen