本文提出了一種名為MT F-CVT的創新停車區域感知方法,能夠準確識別空置停車位和已停放的車輛,並準確判斷它們的方向,覆蓋範圍達25米x25米。MT F-CVT將四個魚眼環視攝像頭投射到一個鳥瞰視角(BEV)特徵網格上,並應用多頭交叉視角注意力機制來增強整體場景理解。然後進行分割和Yolo-Polygon檢測的多任務學習。得益於使用真實3D註釋,即使是小型網絡配置,也能以僅20厘米的誤差定位物體,並達到0.86的F1分數,優於現有方法。