GPT-4V는 다양한 감정 인식 과제에서 강력한 시각적 이해 능력을 보여주지만, 전문 지식이 필요한 미세 표정 인식에서는 한계를 보인다. 또한 다중 모달리티 융합과 시간적 정보 활용에서도 일정 수준의 성능을 보인다.