核心概念
本文提出了一種新的受約束強化學習算法CSAC-LB,能夠有效地平衡熱泵控制中的能源效率和居民舒適度。
摘要
本文提出了一個名為I4B的新型建築物模擬框架,用於評估不同的熱泵控制策略。I4B提供了豐富的自定義選項和標準化的接口,可以方便地集成不同的控制算法。
作者將最新的受約束強化學習算法CSAC-LB應用於熱泵控制問題,並與其他基線算法進行了對比評估。實驗結果表明,CSAC-LB在保持良好的舒適度同時實現較低的能耗方面表現出色,優於其他算法。這得益於CSAC-LB利用線性平滑對數障礙函數,能夠更好地探索約束邊界,從而在能源效率和舒適度之間達到平衡。
相比之下,其他算法如CPO和SAC-Lag在訓練過程中表現不穩定,或無法滿足舒適度要求。MPC方法在無噪聲環境下表現良好,但在存在噪聲干擾時則表現不佳。
總的來說,CSAC-LB在熱泵控制問題上展現出了優秀的性能,為提高建築物能源效率和居民舒適度提供了一種有效的解決方案。
統計資料
建築物1在無噪聲情況下的年能耗為3652 kWh,平均溫度偏差為0.0471°C,最大溫度偏差為2.010°C。
建築物1在有噪聲情況下的年能耗為3608 kWh,平均溫度偏差為0.0603°C,最大溫度偏差為2.373°C。
建築物2在無噪聲情況下的年能耗為1178 kWh,平均溫度偏差為0.0727°C,最大溫度偏差為1.328°C。
建築物2在有噪聲情況下的年能耗為1312 kWh,平均溫度偏差為0.0445°C,最大溫度偏差為1.309°C。