本文首先介紹了開放式無線接取網路中流量調度的背景知識,並概述了相關的機器學習技術及其在流量調度中的應用。隨後,作者提出了一種階層式學習框架,並以階層式深度Q學習(h-DQN)為案例進行詳細介紹。
h-DQN框架採用雙層架構,其中上層的元控制器負責制定長期和高層次的策略,下層的控制器則根據上層策略執行即時的流量調度操作。相比於現有的單層架構和獨立智能體的方案,h-DQN可以實現更高的探索效率、更快的收斂速度和更好的網路性能。
最後,作者通過仿真實驗對h-DQN方案進行了驗證,結果表明該方案在吞吐量和延遲指標上均顯著優於基線算法。
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by Md Arafat Ha... kl. arxiv.org 10-01-2024
https://arxiv.org/pdf/2409.20391.pdfDybere Forespørgsler