本文提出了一個名為I4B的新型建築物模擬框架,用於評估不同的熱泵控制策略。I4B提供了豐富的自定義選項和標準化的接口,可以方便地集成不同的控制算法。
作者將最新的受約束強化學習算法CSAC-LB應用於熱泵控制問題,並與其他基線算法進行了對比評估。實驗結果表明,CSAC-LB在保持良好的舒適度同時實現較低的能耗方面表現出色,優於其他算法。這得益於CSAC-LB利用線性平滑對數障礙函數,能夠更好地探索約束邊界,從而在能源效率和舒適度之間達到平衡。
相比之下,其他算法如CPO和SAC-Lag在訓練過程中表現不穩定,或無法滿足舒適度要求。MPC方法在無噪聲環境下表現良好,但在存在噪聲干擾時則表現不佳。
總的來說,CSAC-LB在熱泵控制問題上展現出了優秀的性能,為提高建築物能源效率和居民舒適度提供了一種有效的解決方案。
Na inny język
z treści źródłowej
arxiv.org
Głębsze pytania