核心概念
生成型AIを活用することで、没入型メディアの通信における帯域消費を大幅に削減できる。
要約
本論文では、没入型コミュニケーションのための生成型AIの活用について探っている。
従来の没入型メディアストリーミングと、生成型AIを活用した提案手法を比較分析している。
提案手法では、360度カメラから得られた映像情報をオブジェクト検出とキャプショニングにより抽出し、大規模言語モデル(LLM)を用いてWebXRコードを生成する。
これにより、99.93%の帯域消費削減を実現できることを示している。
また、生成されたコードを用いて3Dバーチャルオブジェクトを表示し、実際の360度映像との比較を行っている。
提案手法では、通信遅延が従来方式に比べ13倍高くなるが、この課題に対して、エッジ側でファインチューニングしたLLMを活用する方法を提案している。
統計
従来方式の上りリンクと下りリンクの平均帯域は5.9Mbpsであるのに対し、提案手法では最大13.9kbpsまで削減できる。
提案手法の端末間遅延は平均13.66秒であるのに対し、従来方式は980msと13倍短い。
引用
"生成型AIを活用することで、没入型メディアの通信における帯域消費を大幅に削減できる。"
"提案手法では、99.93%の帯域消費削減を実現できる。"