Conceitos essenciais
本論文では、従来のCNNベースの手法を超える精度で、エゴセントリックなビデオフレームから視線を推定する、Transformerベースの新しい深層学習モデルを提案しています。
Resumo
Transformer を用いた視線推定: エゴセントリックな視線推定におけるグローバル-ローカル相関
Bolin Lai, Miao Liu, Fiona Ryan, and James M. Rehg. In the Eye of Transformer: Global-Local Correlation for Egocentric Gaze Estimation. arXiv preprint arXiv:2208.04464v3, 2024.
本論文の目的は、エゴセントリックなビデオフレームのみを用いて、着用者の視線方向をより正確に推定する新しい深層学習モデルを開発することである。