Kernkonzepte
画像生成のためのロバストなコードブック補助型システムの提案と、Transformerによるチャネルノイズへの対処方法。
Zusammenfassung
この論文では、コードブックを活用した画像セマンティックコミュニケーションシステムが提案されています。送信者と受信者間で共有される際にインデックスだけが転送されるため、チャネルノイズに強いシステム設計が必要です。高品質なコードブックの支援により、Transformerを使用して画像生成が実現されます。数値結果と生成された画像は、JPEG+LDPCおよび従来のJSCC手法よりも優れた性能を示しています。
人工知能技術は通信技術の進歩に大きく貢献しており、Semantic Knowledge Base(SKB)はセマンティックエンコーディング/デコーディングを促進し、検索空間を洗練させます。SKB構築では離散量子化されたコードブックへのトレンドがあり、これらはエンコーダーに安定したマッピングターゲット範囲を提供します。
最近ではTransformerの発展が広く認識されており、長距離依存関係を考慮する場面で特に優れたパフォーマンスを発揮します。本論文ではTransformerを利用して画像特徴マップの回復や修正を行い、画像再構成可能な状態に戻すことが目的です。
Statistiken
コードブックサイズ:1024(L = 1024)
ベクトル長:256(q = 256)
Adamオプティマイザー使用
学習率:Stage I → 7 × 10^-5, Stage II → 1 × 10^-4
訓練反復回数:Stage 1 → 415×103, Stage 2 → 200×103
Zitate
"Thanks to the assistance of the high-quality codebook to the Transformer, the generated images at the receiver outperform those of the compared methods in terms of visual perception."
"In recent years, the development of Transformer has been widely recognized, particularly with the emergence of large models such as ChatGPT, which has propelled artificial intelligence to new heights."
"The proposed method adopts a two-stage training mechanism. In Stage 1, the encoder, decoder, and codebook are obtained through E2E training."
"Our method consistently outperforms the comparison method in terms of LPIPS."