Core Concepts
テキストガイダンスが視覚的注意に及ぼす影響を分析し、テキストガイダンスを考慮した視覚的注意予測モデルを提案する。
Abstract
本研究では、テキストガイダンスが視覚的注意に及ぼす影響を包括的に分析しています。具体的には以下の通りです:
テキストガイダンス付き画像の視覚的注意データベース「SJTU-TIS」を構築しました。このデータベースには1200のテキスト-画像ペアと、それに対応する視線追跡データが含まれています。
SJTU-TISデータベースに基づき、様々なテキスト説明が視覚的注意に及ぼす影響を分析しました。
テキストガイダンスの影響を考慮した視覚的注意予測モデル「TGSal」を提案しました。このモデルは画像特徴とテキスト特徴を統合して、様々なテキストガイダンス条件下での画像の視覚的注意を予測することができます。
提案モデルはSJTU-TISデータベースおよび従来の画像視覚的注意データベースにおいて、既存の手法を大きく上回る性能を示しました。
Stats
視覚的注意は、一般的な場面説明よりも、特定の注目対象物の説明によって大きく変化する。
注目対象物ではない物体の説明でも、視覚的注意は大きく変化する。
注目対象物と非注目対象物の両方を含む一般的な説明でも、視覚的注意は部分的に非注目対象物に移動する。
Quotes
"テキスト説明は視覚的注意に大きな影響を及ぼすことが明らかになった。"
"提案モデルはSJTU-TISデータベースおよび従来の画像視覚的注意データベースにおいて、既存の手法を大きく上回る性能を示した。"