의료 분야에서 활용되는 대규모 언어 모델(LLM)의 성능을 다각도로 평가하기 위한 MEDIC 프레임워크를 소개한다. MEDIC은 의료 추론, 윤리 및 편향, 데이터 및 언어 이해, 상황 학습, 임상 안전 및 위험 평가 등 5가지 핵심 차원에서 LLM의 역량을 종합적으로 평가한다.