核心概念
本文提出了一種基於 Moore-Penrose 廣義逆的可微分奇異值分解 (SVD) 方法,解決了傳統 SVD 在深度展開網路訓練過程中遇到的數值不穩定性問題,並在彩色圖像壓縮感知和動態核磁共振成像重建中驗證了其有效性。
摘要
論文資訊
標題:基於 Moore-Penrose 廣義逆的可微分 SVD 及其在反問題成像中的應用
作者:Yinghao Zhang, Yue Hua
單位:哈爾濱工業大學電子與信息工程學院
研究目標
本研究旨在解決傳統奇異值分解 (SVD) 在深度展開網路 (DUNs) 訓練過程中,由於重複奇異值導致的數值不穩定性問題,並提出一個可微分的 SVD 方法。
方法
- 本文分析了傳統 SVD 梯度推導過程,指出當出現重複奇異值時,推導過程中的一個線性方程組會變得欠定,從而導致 SVD 不可微分。
- 為了解決這個問題,本文利用 Moore-Penrose 廣義逆來求解該線性方程組的最小範數最小二乘解,從而提出了一種可微分的 SVD 方法 (SVD-inv)。
- 此外,本文還提供了 SVD-inv 在反問題成像 (IIP) 中的數值穩定性分析。
主要發現
- 實驗結果表明,與現有的 SVD 梯度計算方法相比,SVD-inv 能夠有效解決 SVD 在 DUNs 訓練過程中的數值不穩定性問題。
- 在彩色圖像壓縮感知和動態核磁共振成像重建這兩個 IIP 應用中,使用 SVD-inv 的 DUNs 模型相較於使用傳統 SVD 的模型取得了更好的效能。
主要結論
- 基於 Moore-Penrose 廣義逆的可微分 SVD 方法能夠有效解決傳統 SVD 在深度學習模型訓練中遇到的數值不穩定性問題。
- 該方法為基於低秩正則化的深度展開網路提供了一個更穩定和可靠的訓練框架,並在多個反問題成像應用中展現出其優勢。
研究意義
本研究為基於低秩正則化的深度展開網路的發展提供了新的思路,並為解決其他涉及 SVD 的深度學習模型的數值不穩定性問題提供了參考。
局限與未來研究方向
- 未來可以進一步探索 SVD-inv 在其他類型的深度學習模型和應用中的有效性。
- 可以研究如何進一步提高 SVD-inv 的計算效率,以便應用於更大規模的數據集和模型。
統計資料
在 Float32 数据类型下,最大值不溢出为 3.41 × 10^38。
奇异值阈值 (SVT) 的阈值 𝜏 通常设置为大于 1e-10。
引述
"However, the singular value decomposition (SVD) is non-differentiable when duplicated singular values occur, leading to severe numerical instability during training."
"To the best of our knowledge, this is the first work to provide a comprehensive analysis of the differentiability of the trivial SVD."
"In this paper, we propose a differentiable SVD based on the Moore-Penrose pseudoinverse to address this issue."