Centrala begrepp
本文提出了一種新的多模態融合框架——部分-整體關係融合(PWRF),用於解決多模態場景理解問題。該框架將多模態融合視為部分-整體關係融合,利用膠囊網絡的路由能力,將多個獨立的部分級模態路由到融合的整體級模態,從而生成模態共享和模態特定語義,並應用於合成多模態語義分割和可見光-深度-熱成像顯著目標檢測等任務,實驗結果證明了PWRF框架的有效性。
標題:基於部分-整體關係融合的多模態場景理解
作者:Yi Liu, Chengxin Li, Shoukun Xu, Jungong Han
單位:常州大學計算機科學與人工智能學院;英國謝菲爾德大學計算機科學系
解決現有多模態融合方法大多集中於特定傳感器對,缺乏對多模態融合的深入研究,以及無法很好地挖掘多模態內在共享和特定細節的問題。
提出一個新的多模態融合框架——部分-整體關係融合(PWRF),用於多模態場景理解。