본 연구는 신경망 모델의 STEM(과학, 기술, 공학, 수학) 기술을 평가하기 위한 새로운 과제를 소개한다. 이를 위해 가장 큰 규모의 다중 모달 STEM 데이터셋을 구축하였으며, 최신 신경망 모델들의 성능을 평가하였다. 그 결과, 이러한 모델들의 성능이 여전히 초등학생 수준에 크게 미치지 못하는 것으로 나타났다. 이는 STEM 문제를 해결하기 위해서는 새로운 알고리즘 혁신이 필요함을 시사한다.