MRScore, an LLM-based metric, accurately assesses the quality of automatically generated radiology reports by aligning with human expert evaluations.
GREEN (Generative Radiology Report Evaluation and Error Notation) is a radiology report generation metric that leverages language models to identify and explain clinically significant errors in candidate reports, enabling feedback loops with end-users and outperforming existing approaches.
본 논문에서는 기존 엑스레이 보고서 생성 모델 평가 지표의 한계점을 지적하고, 환자 친화적인 용어를 사용한 새로운 평가 척도와 학습 방법론을 제시하여 모델의 의미 이해도를 향상시키는 프레임워크를 제안합니다.