Grunnleggende konsepter
本文提出了一種新的條件變量流匹配(CVFM)框架,用於在給定非配對樣本的情況下學習源條件分佈和目標條件分佈之間的轉換。
本文介紹了一種新的機器學習框架,稱為條件變量流匹配(CVFM),用於學習源條件分佈和目標條件分佈之間的轉換,即使在提供非配對樣本的情況下也是如此。
研究背景
準確模擬分佈的時變演化是許多科學領域的核心目標,例如單細胞基因組學、氣象學、機器人學和材料科學。在這些領域中,預測隨機非線性動力系統需要一種方法,以便在給定非配對觀測樣本或跨時間不一致的觀測值的情況下,學習時變密度的變換。這種需求是由於這些科學應用中數據收集的實際限制所致。
現有方法的局限性
儘管最近出現了各種解決此問題的方法,例如擴散薛丁格橋 (DSB) 以及流匹配 (FM) 的擴展,但它們的實際效用受到限制,僅允許模擬演化的無條件分佈。在模擬真實系統的動力學時,最重要的問題通常是如何干預會影響最終的動力學。解決這些問題需要能夠揭示條件隨機動力系統的行為,儘管我們檢查其隨時間變化的狀態的能力有限。
CVFM 方法
我們提出了條件變量流匹配 (CVFM),這是一種學習流動的通用方法,可以在連續條件變量中攤銷條件分佈之間的轉換,從而允許跨條件密度流形的預測。這是通過多項新進展實現的,特別是同時對主要變量和條件變量進行樣本條件流,以及促進條件最優傳輸的條件 Wasserstein 距離和核。這些進展共同允許學習系統動力學,前提是測量數據的狀態和條件變量不一致。
實驗結果
我們在一系列越來越具有挑戰性的問題上證明了 CVFM,包括離散和連續條件映射基準測試、圖像到圖像域轉移以及在製造過程中模擬材料內部結構的時間演化。我們觀察到,與其他條件變量相比,CVFM 具有更好的性能和收斂特性。
結論
我們提出了一個新的框架,能夠學習在給定非配對樣本的情況下轉換一般源分佈和目標分佈之間的條件分佈。使用相同的基本方法,我們還提出了能夠逼近條件薛丁格橋問題的擴展。我們的核心貢獻是一個新的算法框架,用於條件 Wasserstein 空間中的度量,該框架配備了正則化條件距離度量、獨立的條件變量流以及在條件變量中跨學習向量場強制結構的核。我們通過合成任務和現實任務驗證了我們提出的方法,證明了其相對於先前方法的顯著改進,並驗證了從未對齊的測量中學習條件動力學過程的可行性。
Statistikk
與其他條件變量相比,CVFM 具有更好的性能和收斂特性。