本研究論文題為《基於對比語言提示的醫學異常檢測:降低偽陽性率的新方法》,探討了如何利用視覺語言模型(VLM)提高醫學影像異常檢測的準確性。作者指出,現有的基於 VLM 的方法,特別是僅使用正面語言提示的方法,容易產生較高的偽陽性率,即錯誤地將正常區域識別為異常。為了解決這個問題,他們提出了一種名為對比語言提示(CLAP)的新方法。
CLAP 方法的核心是利用正負兩種語言提示來引導 VLM 的注意力。正面提示用於引導模型關注潛在的病變區域,而負面提示則用於抑制模型對正常區域的關注,從而降低偽陽性的產生。具體來說,研究人員使用了預先訓練好的醫學 VLM 模型 BiomedCLIP,並結合 U-Net 重建模型進行異常檢測。他們首先利用 CLAP 方法生成注意力圖,突出顯示可疑病變區域,然後使用馬賽克方法遮蔽這些區域,並訓練 U-Net 模型重建被遮蔽的圖像。最後,根據重建誤差來判斷是否存在異常。
為了驗證 CLAP 方法的有效性,研究人員在包含腦部 MRI、肝臟 CT、視網膜 OCT、胸部 X 光和淋巴結組織病理學圖像的 BMAD 數據集上進行了實驗。實驗結果表明,與僅使用正面提示的方法相比,CLAP 方法可以顯著降低偽陽性率,並提高異常檢測的整體性能,尤其是在包含細小、不規則圖像的數據集上表現更為出色。
本研究提出了一種基於對比語言提示的醫學異常檢測新方法 CLAP,通過結合正負兩種語言提示,有效降低了偽陽性率,提高了異常檢測的準確性。該方法為醫學影像分析領域提供了一種新的思路,具有重要的臨床應用價值。未來研究方向包括自動生成語言提示,以進一步提高該方法的實用性和可擴展性。
Naar een andere taal
vanuit de broninhoud
arxiv.org
Belangrijkste Inzichten Gedestilleerd Uit
by YeongHyeon P... om arxiv.org 11-13-2024
https://arxiv.org/pdf/2411.07546.pdfDiepere vragen