本論文は、屋内シーンの認識のためのSpaCoNetを提案する。SpaCoNetは、セマンティックセグメンテーションを利用して空間関係とオブジェクトの共起を同時にモデル化する。
まず、Semantic Spatial Relation Module (SSRM)を構築し、セマンティックセグメンテーションを用いて空間情報を抽出し、オブジェクト間の多様な空間関係を端から端まで探索する。次に、Semantic Node Feature Aggregation Moduleを設計し、オブジェクトに入力シーン関連特徴を割り当てることで、同一オブジェクトを異なるシーンで区別できるようにする。最後に、Global-Local Dependency Moduleを構築し、注意メカニズムを使ってオブジェクト間の長距離共起を探索し、シーン認識のための特徴表現を生成する。
実験結果は、提案手法の有効性と汎用性を示している。
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Chuanxin Son... at arxiv.org 05-02-2024
https://arxiv.org/pdf/2305.12661.pdfDeeper Inquiries