核心概念
連合学習を用いることで、強化学習ベースのHVAC制御エージェントの学習速度が向上し、未知の環境でも優れた一般化性能を発揮する。
要約
本論文では、データセンターのHVAC制御のために連合学習を活用する手法を提案している。
従来のHVAC制御手法には課題がある
古典的なアルゴリズムは建物の熱特性を考慮できず、天気予報を活用できない
モデル予測制御は建物モデルの構築が困難
強化学習は学習効率が低く、実環境への適用が難しい
連合学習を用いることで、複数の建物で並行して学習を行うことができる
学習速度の向上と一般化性能の向上につながる
各建物の個別データを共有せずにモデルを学習できるため、プライバシーが保護される
実験では、連合学習を用いたSoft Actor-Critic (SAC)エージェントの性能を評価
3種類のクライアント側最適化手法(SGD、SGDM、Adam)を比較
連合学習アルゴリズムとしてFedAvg、FedAvgM、FedAdamを検討
未知の環境でも連合学習エージェントが最も優れた性能を発揮
学習の収束速度も連合学習の方が速い
学習の安定性も連合学習の方が高い
統計
データセンターの年間総消費電力は約100 kW規模である。
快適温度範囲は18°C~27°Cとし、目標温度は22.5°Cに設定した。
引用
"連合学習を用いることで、強化学習ベースのHVAC制御エージェントの学習速度が向上し、未知の環境でも優れた一般化性能を発揮する。"
"各建物の個別データを共有せずにモデルを学習できるため、プライバシーが保護される。"