核心概念
MonoPlane 是一個基於單目視覺的 3D 平面重建框架,它利用預先訓練的單目深度和法線估計模型,結合基於圖形切割的 RANSAC 演算法,實現了對不同場景的泛化平面重建能力。
摘要
MonoPlane:利用單目幾何線索實現泛化的 3D 平面重建
本論文提出了一種名為 MonoPlane 的泛化 3D 平面檢測和重建框架。與需要多幅圖像或 RGB-D 輸入的基於魯棒估計器的傳統方法以及存在域轉移問題的基於學習的方法不同,MonoPlane 結合了兩者的優點,建立了一個基於單目幾何線索的平面重建流程,從而在實際場景中實現了準確、魯棒和可擴展的 3D 平面檢測和重建。
研究目標
利用單目幾何線索實現泛化的 3D 平面重建,避免傳統方法對深度或多視角輸入的依賴以及基於學習方法的域轉移問題。
方法
單目幾何線索提取: 利用預先訓練的大規模神經網絡從單幅圖像中獲取深度和表面法線信息。
基於圖形切割的 RANSAC: 將單目幾何線索融入到基於接近度的 RANSAC 框架中,依次擬合每個平面實例。
利用有效的 3D 點接近度,並在 RANSAC 中通過圖形對這種接近度進行建模,以指導從噪聲單目深度中進行平面擬合。
進行圖像級多平面聯合優化,以提高所有平面實例之間的一致性。
稀疏視圖擴展: 設計了一個簡單而有效的流程,將單視圖解決方案擴展到稀疏視圖 3D 平面重建。
結果
在多個數據集上的實驗結果表明,MonoPlane 相比於基準方法具有更好的零樣本泛化能力,在遷移設置中實現了最先進的平面重建性能。
探索了單目幾何線索在 3D 平面重建中的應用,實現了從單幅或稀疏 RGB 圖像中進行泛化的 3D 平面重建。
提出了一種基於點接近度的圖形切割 RANSAC 演算法,通過結合單目幾何線索,大大增強了處理噪聲輸入或複雜場景的魯棒性。
構建了一個適用於單幅圖像和稀疏視圖圖像的泛化 3D 平面重建系統,無需任何平面真值或特定域的微調。