本文介紹了一個用於食道內視鏡視頻拼接的自動化框架。該框架包括三個主要步驟:
影像展開:使用Depth Anything模型對圓形內視鏡影像進行深度中心定位和展開,將食道轉換為二維平面格式。
影像匹配:整合LoFTR、SIFT和ORB等特徵匹配方法,創建特徵點過濾池,並引入基於深度中心偏移的過濾閾值,確保特徵點水平分佈一致。
影像拼接:提出密度加權同構矩陣優化(DWHO)算法,結合特徵點密度加權,優化水平和垂直方向的影像對齊,生成無縫的食道全景圖。
實驗結果顯示,該框架在SSIM和RMSE指標上優於傳統方法,能夠生成高質量、連續的食道內視鏡影像拼接結果,為臨床診斷和治療提供更完整的視覺信息。
翻譯成其他語言
從原文內容
arxiv.org
深入探究