核心概念
DPA-Netは、3枚程度の異なる視点からのRGB画像から、凸包の集合として3Dオブジェクトを抽象的に表現する。
要約
本論文では、DPA-Netと呼ばれる手法を提案している。DPA-Netは、3枚程度の異なる視点からのRGB画像から、3Dオブジェクトを凸包の集合として抽象的に表現する。
具体的には以下の通り:
入力画像から特徴を抽出し、それらを統合して形状特徴を得る
形状特徴から、凸二次曲面プリミティブのパラメータを予測する
予測したプリミティブを交差と和集合の演算で組み立てることで、3Dオブジェクトの抽象表現を得る
画像空間でのレンダリング誤差を最小化することで、プリミティブ組み立てを学習する
テスト時の適応により、入力オブジェクトに特化した最適な組み立てを得る
提案手法は、3D監督なしで動作し、構造的に意味のある3D抽象表現を出力できる。定量評価と応用例の結果から、提案手法の有効性が示されている。
統計
3枚程度の異なる視点からのRGB画像を入力とする
3Dオブジェクトを凸包の集合として表現する
交差と和集合の演算を用いてプリミティブを組み立てる
画像空間でのレンダリング誤差を最小化して学習する