本研究では、無線ネットワークの効率的な最適化のための継続的モデルベース強化学習手法を提案している。
主な内容は以下の通り:
無線ネットワークの最適化問題を、重複するアクション空間を持つ一連のマルコフ決定過程として定式化した。
継続的強化学習のフレームワークである Progress-and-Compress (P&C)を用いて、新しい無線ネットワークサイトに対するパラメータ最適化ポリシーを効率的に学習する。
P&Cを用いることで、従来の手法に比べて50%のデータ量削減と最大4%のスループット向上を達成した。
提案手法は、モデルベース強化学習とモジュール型アーキテクチャを組み合わせることで、高次元の状態空間と行動空間、高ノイズレベルの課題に対処している。
提案手法は、無線ネットワークの新規サイト展開時の最適化ポリシー導入リードタイムを大幅に短縮できる。
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Cengis Hasan... a las arxiv.org 05-01-2024
https://arxiv.org/pdf/2404.19462.pdfConsultas más profundas