核心概念
本文提出兩種基於變分自編碼器 (VAE) 的生成模型,用於解決無似然函數的模擬推理問題,並與現有方法比較其在效率和可擴展性方面的優勢。
本研究論文介紹了一種基於變分自編碼器 (VAE) 的生成模型方法,用於解決無似然函數的模擬推理問題。該方法利用變分自編碼器中的潛變量來有效估計由隨機模擬產生的複雜後驗分佈。
論文探討了兩種處理先驗分佈的變分方法:
條件先驗 VAE (CP-VAE):使用基於觀測數據的多元先驗網絡調整先驗,增強了跨不同後驗查詢的泛化能力。
無條件先驗 VAE (UP-VAE):利用標準高斯先驗,在保持簡單性的同時有效地捕捉複雜的後驗分佈。
研究人員在已建立的基準問題上證明了這些模型的有效性,其結果與基於流的方法相當,同時保持了計算效率和可擴展性。
模擬推理 (SBI) 旨在從觀測數據 y 中推斷包含隨機狀態 ξ 的隨機模擬模型 M(θ, ξ) 的參數 θ。校準後,模擬模型可用於在相應物理過程的背景下推理、分析和解釋觀測數據 y。
然而,由於模型的隨機性和潛在的多值性,SBI 面臨著一些挑戰。不同的參數值集可能會產生相似的觀測結果,而相似的參數可能會導致不同的輸出。因此,任務是在貝葉斯設定中推斷後驗分佈 p(θ | y)。
深度學習方法在 SBI 中越來越受歡迎,這些方法直接逼近模型似然函數或後驗分佈。然而,基於流的模型(如歸一化流)在計算上可能很密集,並且將神經網絡的設計空間限制為具有計算效率雅可比計算的可逆函數。其他方法(如生成對抗網絡 (GAN))可能會遇到訓練不穩定、模式崩潰以及平衡生成器和鑑別器網絡的困難。