本研究では、360度パノラマ画像から部屋のレイアウトを推定する際の根本的な課題である「曖昧さ」の問題に取り組んでいる。既存のデータセットでは、部屋の境界線の定義が曖昧であり、同じデータセット内でも開口部の扱いが一定ではない。
提案手法の「双レイアウトモデル」は、2種類の異なるレイアウト(enclosed type: 部屋を囲む、extended type: 開口部まで含む)を同時に予測することで、この曖昧さの問題に対処する。モデルは、共有特徴抽出部、2つの大域的コンテキストエンベディング、共有特徴ガイダンスモジュールから構成される。
大域的コンテキストエンベディングは、それぞれのレイアウトタイプに関連するコンテキスト情報をエンコードする。共有特徴ガイダンスモジュールは、画像特徴とこれらのエンベディングを融合し、レイアウトタイプに適合した特徴を生成する。
さらに、提案手法は「曖昧さ検出」の機能も備えており、2つの予測結果の差異から曖昧な領域を特定できる。実験では、既存手法を大きく上回る性能を示し、特に曖昧な領域が多い場合に顕著な改善を示した。
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Yu-Ju Tsai,J... at arxiv.org 04-16-2024
https://arxiv.org/pdf/2404.09993.pdfDeeper Inquiries