Core Concepts
物体の除去や挿入を行う際、その物体が及ぼす影響(遮蔽、影、反射など)を正確にモデル化することが重要である。本手法では、物体の除去と挿入を両立する実用的なアプローチを提案する。
Abstract
本研究では、物体の除去と挿入のための新しい手法「ObjectDrop」を提案している。物体の除去や挿入を行う際、その物体が及ぼす影響(遮蔽、影、反射など)を正確にモデル化することが重要だが、従来の自己教師学習アプローチでは限界があった。
そこで本手法では、物理的に物体を除去した状態の画像(counterfactual)を収集し、それを用いて微調整を行うことで、物体の影響を正確にモデル化できるようにした。この手法により、物体の除去において従来手法を大きく上回る性能を達成した。
一方で、物体の挿入については、影や反射の合成が除去よりも複雑であるため、同様の手法では不十分であることが分かった。そこで本手法では、物体除去モデルを用いて大規模な合成データセットを作成し、それを利用してモデルの微調整を行う「ブートストラップ教師学習」を提案した。この手法により、物体の挿入においても従来手法を大きく上回る性能を達成した。
Stats
物体除去の性能評価において、提案手法はPSNR 23.153、DINO 0.948、CLIP 0.959、LPIPS 0.048と、ベースラインを大きく上回る結果を示した。
物体挿入の性能評価において、提案手法はPSNR 21.625、DINO 0.939、CLIP 0.950、LPIPS 0.057と、ベースラインを大きく上回る結果を示した。