Core Concepts
EyeFormerは、視線の空間的・時間的特性を包括的に予測できる新しい視線予測モデルである。個人の視線パターンを学習し、それに基づいて個人化された視線予測を行うことができる。
Abstract
本研究では、EyeFormerと呼ばれる新しい視線予測モデルを提案している。EyeFormerは以下の特徴を持つ:
視線の空間的特性(注視位置)と時間的特性(注視順序、注視時間)を統合的に予測できる。
個人の視線パターンを学習し、少数の視線データから個人化された視線予測を行うことができる。
グラフィカルユーザーインターフェース(GUI)や自然画像など、様々な種類の視覚刺激に対して優れた予測性能を示す。
具体的な手法は以下の通り:
視線予測を強化学習の問題としてモデル化し、Transformerアーキテクチャをポリシーネットワークとして使用する。
視線の空間的・時間的特性を表すガウス分布を出力し、非微分的な報酬関数を最適化する。
少数の個人の視線データを用いて、個人の視線パターンを学習し、個人化された視線予測を行う。
実験の結果、EyeFormerは既存の視線予測モデルと比較して優れた性能を示し、特に個人化された視線予測において優位性が確認された。また、GUIレイアウトの最適化など、視線予測の応用例も示されている。
Stats
視線予測の精度は、既存モデルと比べて全ての評価指標で優れている。
個人化された視線予測では、対象ユーザーの視線パターンを良く捉えられている。
Quotes
"EyeFormerは、視線の空間的・時間的特性を包括的に予測できる新しい視線予測モデルである。"
"EyeFormerは、個人の視線パターンを学習し、それに基づいて個人化された視線予測を行うことができる。"