核心概念
本文提出了一種名為 Sim Anything 的新方法,可以基於靜態三維物件生成具有真實物理效果的動態模擬,並顯著提升了模擬速度。
摘要
研究目標
本文旨在解決現有三維動態模擬方法存在的不足,例如需要手動設置物理參數、依賴計算成本高昂的視頻生成模型等問題,提出一種基於靜態三維物件自動生成具有真實物理效果的動態模擬方法。
方法概述
本文提出的 Sim Anything 方法主要包含以下步驟:
- 三維開放詞彙分割: 利用基礎模型對輸入圖像進行分割,並將二維分割結果提升至三維空間,實現對場景中物件的精確分割。
- 基於 MLLM 的物理屬性感知 (MLLM-P3): 利用多模態大型語言模型 (MLLM) 對物件的材料和物理屬性進行零樣本預測,得到平均物理屬性值。
- 材料屬性分佈預測 (MPDP): 基於平均物理屬性值和物件的幾何形狀,利用 MPDP 模型預測物理屬性的完整分佈,將問題轉化為概率分佈估計,降低計算成本。
- 基於物理幾何自適應採樣 (PGAS) 的模擬: 根據物件的楊氏模量和曲率自適應調整採樣半徑,利用 PGAS 策略對驅動粒子進行採樣,提高模擬精度並降低計算成本。
- 基於 MPM 的物理模擬: 利用 MLS-MPM 模擬器對物件進行物理模擬,生成逼真的動態效果。
實驗結果
實驗結果表明,Sim Anything 方法能夠有效預測物件的物理屬性,並生成比現有方法更逼真、更自然的動態效果,同時顯著縮短了模擬時間。
結論
Sim Anything 方法為生成具有真實物理效果的三維動態模擬提供了一種新的思路,並在模擬速度和效果方面取得了顯著進步,為虛擬現實、遊戲等領域的應用提供了新的可能性。
統計資料
使用 768 個子步驟模擬視頻幀之間的時間間隔,每個子步驟的持續時間為 4.34 × 10−5 秒。
在單個 NVIDIA 3090 GPU 上進行所有實驗。
引述
"Sim Anything achieves more realistic motion than state-of-the-art methods within 2 minutes on a single GPU."
"Sim Anything is the first to use MLLM for zero-shot physical property estimation of objects in 3D scenes."