本論文は、5Gネットワークにおける輻輳制御の課題に取り組んでいる。パケット化されたフロントホール網では、従来の輻輯制御アルゴリズムでは低遅延と高スループットの要求を満たすことが難しい。そのため、強化学習(RL)ベースの輻輳制御アルゴリズムが注目されている。
RL ポリシーは優れた性能を発揮するが、ニューラルネットワークモデルの実時間推論と解釈可能性の課題がある。本論文では、これらの課題を解決するため、以下の手順を提案している:
導出された閉形式の数式表現は、実時間推論が可能で解釈可能であり、かつRLポリシーの性能と一般化能力を維持することが示されている。
具体的には、以下のような結果が得られている:
Іншою мовою
із вихідного контенту
arxiv.org
Ключові висновки, отримані з
by Jean Martins... о arxiv.org 05-03-2024
https://arxiv.org/pdf/2405.01435.pdfГлибші Запити