放射線レポート生成の自動評価のために、LLMベースの報酬モデルであるMRScoreを提案する。MRScoreは、放射線医の専門知識に基づいて設計された評価基準に従って、GPT-4によって生成された大量の評価サンプルを用いて学習される。実験の結果、MRScoreは従来の評価指標よりも人間の評価とより高い相関を示すことが明らかになった。