核心概念
提出一種基於病理線索驅動的表示學習模型,通過多角度的病理線索提取和跨模態特徵對齊,生成準確的腦部CT報告。
摘要
本文提出了一種基於病理線索驅動的表示學習模型(PCRL),用於生成準確的腦部CT報告。
首先,PCRL從三個角度提取病理線索:
- 分割線索:利用預訓練的分割模型SAM生成候選分割掩碼,並通過MedCLIP檢索與病理實體相關的分割掩碼。
- 實體線索:提取報告中的病理實體描述,並利用統一的大型語言模型(LLM)生成跨模態實體表示。
- 主題線索:利用整個報告文本和全景圖像生成全局視覺-文本表示,以增強報告的整體質量。
然後,PCRL將上述三種病理線索驅動的表示通過聯合訓練的方式,融合到統一的LLM中,實現了表示學習和報告生成的無縫銜接。
實驗結果表明,PCRL在腦部CT報告生成任務上取得了顯著的性能提升,體現了利用多角度病理線索提取和跨模態對齊的有效性。
統計資料
雙側大腦半球對稱,左側基底節區見小片狀低密度影,邊緣欠清晰,無佔位效應。
各腦室、腦池大小形態正常,中線結構居中。
幕下小腦,腦幹無異常。
引述
"我們提出了一種基於病理線索驅動的表示學習模型(PCRL),通過多角度的病理線索提取和跨模態特徵對齊,生成準確的腦部CT報告。"
"PCRL將表示學習和報告生成的過程融合在統一的LLM中,實現了兩者的無縫銜接。"