本文提出了一種名為"物理可行的語義分割"(PhyFea)的新方法,用於改善現有的語義分割模型。現有的語義分割模型通常是以數據驅動的方式進行優化,僅最小化訓練數據上的像素分類目標。這種純數據驅動的範式往往會導致不合理的分割,尤其是當輸入圖像的域與訓練期間遇到的域發生偏移時。
PhyFea從語義分割數據集的訓練集中提取明確的物理約束條件,並在訓練過程中強制執行這些約束條件,以促進預測的可行性。具體來說,PhyFea識別了兩種物理異常:不可行的包含和不連續的分段。它通過應用選擇性膨脹和區域開放等形態學操作來解決這些問題。
PhyFea在ADE20K、Cityscapes和ACDC等三個主要基準上顯著提高了語義分割的性能。在Cityscapes上,PhyFea在SegFormer-B4和OCRNet基線上分別提高了0.6%和0.7%的mIoU。在ADE20K上,PhyFea在OCRNet基線上提高了1.02%的mIoU,在SegFormer-B4基線上提高了1.44%。在ACDC上,PhyFea在OCRNet基線上提高了15.77%的mIoU,在SegFormer-B4基線上提高了2.17%。
翻譯成其他語言
從原文內容
arxiv.org
深入探究