Core Concepts
事前学習済みの基盤モデルを活用することで、共有知識ベースの必要性を排除し、送受信機の端末間の統合学習を不要とする、汎用的な意味的通信フレームワークを提案する。また、重要な意味的情報を含むテキストプロンプトと、生成プロセスを誘導する追加の意味的モダリティを、適切な通信方式で伝送することで、低遅延かつチャネル適応的な意味的通信を実現する。
Abstract
本論文では、事前学習済みの基盤生成モデルを活用した意味的通信フレームワークを提案する。
送信機では、入力信号の意味的内容を複数のモダリティに分解する。最も重要な意味的情報をテキストプロンプトとして抽出し、他のモダリティは生成プロセスを誘導する追加の条件信号として抽出する。
テキストプロンプトは信頼性の高い再送方式で伝送し、他のモダリティは適応的な変調・符号化方式で伝送する。
さらに、意味的重要度と遅延を考慮した最適な送信パワー配分と変調方式の選択を行う。
受信機では、事前学習済みの生成モデルを用いて受信した意味的情報から高品質な信号を合成する。
シミュレーション結果から、提案手法が超低レート、低遅延、チャネル適応的な意味的通信を実現できることを示す。
Stats
超低レートの意味的通信を実現するため、テキストプロンプトのビット数は数十ビットと非常に小さい。
一方、エッジマップなどの追加のモダリティのビット数は数千ビットと大きい。
Quotes
"GenAI models are trained to maximize the perceptual quality and the fundamental bounds on Generative SemCom are governed by the rate-distortion-perception theory [8], [9], which determines the threefold trade-off between rate, distortion, and perceptual quality of the reconstructed signal."
"The recent advent of powerful Generative Foundation Models provides ample opportunities to develop ultra-low-rate semantic communication systems. The ultra low rate transmission can be achieved by transmitting data semantics in compressed format as a textual message or prompt."