核心概念
連合学習を用いることで、強化学習ベースのHVAC制御エージェントの学習速度が向上し、未知の環境でも優れた一般化性能を発揮する。
摘要
本論文では、データセンターのHVAC制御のために連合学習を活用する手法を提案している。
- 従来のHVAC制御手法には課題がある
- 古典的なアルゴリズムは建物の熱特性を考慮できず、天気予報を活用できない
- モデル予測制御は建物モデルの構築が困難
- 強化学習は学習効率が低く、実環境への適用が難しい
- 連合学習を用いることで、複数の建物で並行して学習を行うことができる
- 学習速度の向上と一般化性能の向上につながる
- 各建物の個別データを共有せずにモデルを学習できるため、プライバシーが保護される
- 実験では、連合学習を用いたSoft Actor-Critic (SAC)エージェントの性能を評価
- 3種類のクライアント側最適化手法(SGD、SGDM、Adam)を比較
- 連合学習アルゴリズムとしてFedAvg、FedAvgM、FedAdamを検討
- 未知の環境でも連合学習エージェントが最も優れた性能を発揮
- 学習の収束速度も連合学習の方が速い
- 学習の安定性も連合学習の方が高い
统计
データセンターの年間総消費電力は約100 kW規模である。
快適温度範囲は18°C~27°Cとし、目標温度は22.5°Cに設定した。
引用
"連合学習を用いることで、強化学習ベースのHVAC制御エージェントの学習速度が向上し、未知の環境でも優れた一般化性能を発揮する。"
"各建物の個別データを共有せずにモデルを学習できるため、プライバシーが保護される。"