GMAI-MMBench是一个全面的多模态医疗AI评估基准,涵盖了38种医疗影像模式、18种临床VQA任务和18个临床科室,为评估和提升医疗人工智能系统的性能提供了重要支持。
本研究评估了ChatGPT 3.5和4.0版本在中国门诊分诊指导中的一致性,为将大语言模型集成到门诊服务中提供了见解。