核心概念
本文提出了一種基於精簡擴散模型的語義通信框架(SC-CDM),用於無線圖像傳輸,旨在提高圖像重建的保真度和語義準確性,尤其是在頻寬受限的環境中。
摘要
SC-CDM:基於精簡擴散模型的語義通信:提升圖像語義通信的質量
本研究提出了一種名為 SC-CDM 的生成式語義通信框架,用於無線圖像傳輸。該框架旨在解決現有語義通信方案在平衡生成模型效率和傳輸複雜性方面的局限性,通過利用生成模型的潛力來彌合這些差距,進一步提高傳輸質量。
研究背景
隨著無線通信的快速發展,數據和移動設備之間的連接呈指數級增長。由於 5G 技術接近香農物理層容量極限,語義通信 (SC) 預計將成為 6G 網絡的關鍵技術。與傳統通信不同,SC 整合了深度學習 (DL),使用深度神經網絡 (DNN) 直接從源數據中提取與特定任務相關的核心語義信息,然後將其封裝在編碼特徵中。然而,現有的語義通信方案未能平衡生成模型的有效性和語義通信傳輸的複雜性。
研究方法
SC-CDM 框架包括三個主要階段:聯合源通道編碼器、聯合源通道解碼器和語義微調模塊。
發射機
在發射機端,首先使用基於 swin Transformer 的編解碼器作為端到端語義圖像傳輸的骨幹網絡。與傳統的 Vision Transformer (ViT) 相比,swin Transformer 具有計算複雜度低、支持分層表示以及增強空間感知能力等優勢。
接收機
在接收機端,利用擴散模型在合成多媒體內容方面的優勢,通過保留傳輸的語義信息來重建高質量圖像。該模型利用了擴散模型 (DM) 先進的分佈映射能力來計算緊湊的條件向量,從而在解碼階段增強了高效的圖像恢復。與傳統的擴散模型相比,這種方法顯著降低了計算需求。
實驗結果
在真實數據集上的實驗結果表明,與傳統的基於分離的方案相比,SC-CDM 框架表現出顯著的優於傳統基於分離的方案,並且在 DeepJSCC 的基礎上進一步將 PSNR 提高了 17% 以上。
本研究的主要貢獻如下:
設計了一種基於 swin Transformer 的語義通信架構,以最大程度地減少接收機處重建信號與發射機處源之間的失真差異。
在生成式語義通信框架內採用了緊湊的擴散模型,該模型擅長從壓縮的語義信息中重建複雜場景。
通過真實數據集的實驗驗證了所提出框架的有效性和魯棒性。