핵심 개념
生成AIモデルをリソースの限られたエッジネットワークに効率的に展開するために、モデルキャッシングとリソース割り当ての共同最適化問題をDDPGベースの強化学習を用いて解決し、低遅延かつ高品質なAI生成コンテンツサービスの提供を目指す。
초록
生成AI対応無線エッジネットワークにおけるモデルキャッシングとリソース割り当ての共同最適化:論文要約
この研究論文では、生成AI(GenAI)対応の無線エッジネットワークにおいて、高品質なAI生成コンテンツ(AIGC)サービスを低遅延で提供するための、モデルキャッシングとリソース割り当ての共同最適化問題に取り組んでいます。
近年、GenAIは、画像、音楽、自然言語など、多様なAIGCを生成できる変革的なツールとして登場しました。しかし、数十億のパラメータを持つGenAIモデルは、展開と実行に膨大なメモリ容量と計算能力を必要とするため、リソースの限られたエッジネットワークに大きな課題を突きつけています。
本研究では、GenAI対応無線エッジネットワークにおけるモデルキャッシングとリソース割り当ての共同最適化問題を、高品質なAIGCの提供とAIGCサービス提供の遅延最小化のバランスを取りながら解決することを目的としています。