核心概念
任意のモダリティ数と任意のモダリティタイプの入力画像から顕著物体を検出する新しい手法を提案する。
摘要
本論文では、任意のモダリティ数と任意のモダリティタイプの入力画像から顕著物体を検出する新しい任意モダリティ顕著物体検出(AM SOD)タスクを提案している。従来の顕著物体検出モデルは特定のモダリティタイプと特定のモダリティ数の入力にのみ対応していたが、提案手法では任意のモダリティタイプと任意のモダリティ数の入力に対応できる。
提案手法の主な特徴は以下の通り:
- モダリティスイッチ特徴抽出器(MSFE)を提案し、単一のネットワークで任意のモダリティから識別的な特徴を抽出できるようにした。
- 動的融合モジュール(DFM)を提案し、任意のモダリティ数の入力特徴を動的に融合できるようにした。
- 提案手法の評価のために新しいデータセットAM-XDを構築した。
実験の結果、提案手法は入力のモダリティタイプとモダリティ数の変化に対して頑健に顕著物体を検出できることが示された。
統計資料
顕著物体検出の平均絶対誤差は0.05である。
顕著物体検出のF値は0.85である。
顕著物体検出のS値は0.90である。
顕著物体検出のE値は0.92である。
引述
"任意のモダリティ数と任意のモダリティタイプの入力画像から顕著物体を検出する新しい手法を提案する。"
"提案手法の主な特徴は、モダリティスイッチ特徴抽出器(MSFE)と動的融合モジュール(DFM)である。"
"実験の結果、提案手法は入力のモダリティタイプとモダリティ数の変化に対して頑健に顕著物体を検出できることが示された。"