基於人類主動視覺的理論,我們提出了一個配備新穎的基於注視的主動感知(GAP)的系統,能夠通過選擇性地注視圖像中最顯著的部分並以高分辨率處理它們來提取視覺關係。這些注視位置的關係幾何以及相應的注視內容為表示圖像結構提供了基礎,從而實現了對未知視覺輸入的出色泛化能力和高樣本效率。