비전 언어 모델의 그라운딩 능력을 정량화하기 위해 GradCAM 활성화 맵을 활용한 새로운 평가 지표를 제안한다. 이를 통해 기존 Pointing Game 평가 방식의 한계를 극복하고, 모델의 그라운딩 성능을 보다 세부적으로 분석할 수 있다.