採用高維度狀態表示的深度強化學習方法,結合模型壓縮技術,可以有效提升交通信號控制系統的性能,並降低運算成本。
本文提出了一種基於回饋-前饋機制的城市交通信號控制策略,該策略利用單個迴路偵測器估計每個路段的佔用率和外生需求,並透過前饋項主動應對需求變化,相較於僅依賴歷史數據的傳統方法,顯著提升了交通效率。