Core Concepts
최근 LLM의 발전에도 불구하고 복잡한 물리학 문제를 해결하는 데 어려움을 겪고 있다. 이를 해결하기 위해 이미지 캡셔닝과 강화 학습 기반 인간 피드백(RLHF) 기술을 활용하여 LLM의 성능을 향상시킨다.
Abstract
최근 LLM은 텍스트 요약, 생성 등의 작업에서 뛰어난 성과를 보이고 있지만, 복잡한 물리학 문제를 해결하는 데 어려움을 겪고 있다.
이를 해결하기 위해 MM-PhyQA 데이터셋을 활용하여 LLM을 fine-tuning하고, 이미지 캡셔닝과 RLHF 기술을 적용한다.
이미지 캡셔닝을 통해 이미지에 대한 자세한 설명을 제공하여 LLM의 이해도를 높이고 환각을 줄인다.
RLHF 기술을 통해 인간 피드백을 활용하여 LLM의 문제 해결 능력, 진실성, 추론 능력을 향상시킨다.
실험 결과, 이미지 캡셔닝과 RLHF 기술을 적용한 모델이 가장 높은 성능을 보였다.
Stats
이미지 캡셔닝과 RLHF 기술을 적용한 모델의 정확도는 83.28%로 가장 높았다.
이미지 캡셔닝만 적용한 모델의 정확도는 82.52%였다.
이미지만 사용한 모델의 정확도는 53.3%로 가장 낮았다.
Quotes
"최근 LLM의 발전에도 불구하고 복잡한 물리학 문제를 해결하는 데 어려움을 겪고 있다."
"이미지 캡셔닝을 통해 이미지에 대한 자세한 설명을 제공하여 LLM의 이해도를 높이고 환각을 줄일 수 있다."
"RLHF 기술을 통해 인간 피드백을 활용하여 LLM의 문제 해결 능력, 진실성, 추론 능력을 향상시킬 수 있다."