LMOD는 안과 영상 이해, 진단 분석, 인구통계 추출을 위한 대규모 다중 모달 데이터셋 및 벤치마크이다. 이를 통해 13개의 최신 대규모 비전-언어 모델의 성능을 평가한 결과, 안과 영상 이해, 진단 분석, 인구통계 추출 등에서 여전히 많은 한계가 있음을 확인하였다.