최근 LLM의 발전에도 불구하고 복잡한 물리학 문제를 해결하는 데 어려움을 겪고 있다. 이를 해결하기 위해 이미지 캡셔닝과 강화 학습 기반 인간 피드백(RLHF) 기술을 활용하여 LLM의 성능을 향상시킨다.