本文提出了一種名為"自動內視鏡息肉分割的自我增強語義模型"的創新方法,以解決現有方法在捕捉息肉上下文信息方面的局限性。
首先,該方法採用視覺元變換器編碼器提取多尺度特徵。然後,提出了局部到全局空間融合(LGSF)機制,以捕捉局部和全局空間特徵。最後,利用自我增強語義(SES)模組,將額外的語義信息融入高層特徵,以更好地理解息肉的上下文信息。
通過在五個內視鏡息肉基準數據集上的實驗,該方法在學習能力和泛化能力方面都表現出優異的性能,顯著優於最新的息肉分割方法。定性結果進一步證實了該方法在處理噪聲、模糊邊界和複雜前景等挑戰性場景時的出色表現。
Başka Bir Dile
kaynak içeriğinden
arxiv.org
Önemli Bilgiler Şuradan Elde Edildi
by Quang Vinh N... : arxiv.org 10-03-2024
https://arxiv.org/pdf/2410.01210.pdfDaha Derin Sorular