本文提出了一個名為 X-RGen 的放射學報告生成框架,該框架模仿放射科醫生的思維過程,通過跨解剖區域的分析和醫學知識整合,生成與影像語義一致且診斷相關的報告。
本文提出了一種利用多模態大型語言模型自動生成 3D 醫學影像報告的新方法,通過 ViT3D 影像編碼器和 Asclepius-Llama3-8B 語言模型,實現了從 3D 醫學影像到文字報告的自動轉換,並在 MRG 和 VQA 任務上取得了良好的效果。