일본 생물의학 대형 언어 모델의 성능을 종합적으로 평가하기 위한 대규모 벤치마크 JMedBench를 제안한다. 이 벤치마크는 5가지 과제에 걸쳐 20개의 일본 생물의학 데이터셋과 8개의 대표적인 모델을 포함하고 있다.