核心概念
雖然大型多模態模型 GPT-4o 在解決需要視覺資訊的電腦圖學問題上展現出巨大潛力,但其結果的準確性和品質仍存在重大限制。
Feng, T. H., Denny, P., Wünsche, B. C., Luxton-Reilly, A., & Whalley, J. (2024). An Eye for an AI: Evaluating GPT-4o’s Visual Perception Skills and Geometric Reasoning Skills Using Computer Graphics Questions. In SIGGRAPH Asia 2024 Educator’s Forum (SA Educator’s Forum ’24) (pp. 1–8). ACM. https://doi.org/10.1145/3680533.3697064
本研究旨在探討 GPT-4o 在解決需要視覺感知和幾何推理能力的電腦圖學問題上的表現。