核心概念
連邦学習(FL)とTRPOを組み合わせたアプローチにより、スマートグリッドの課題に対して効果的な最適政策を学習することができる。個別の建物の特性を捉えつつ、建物間の特徴の相互関係を活用することで、未知のデータ分布に対しても高い一般化性能を発揮する。
要約
本研究では、スマートグリッドの課題に対して、連邦学習(FL)とTRPO(Trust Region Policy Optimization)を組み合わせたアプローチを提案している。
スマートグリッドは複雑な相互依存関係を持つシステムであり、機械学習は有効な解決策となる。しかし、モデルの一般化性と個人情報の保護が課題となる。
提案手法では、FLにより分散データを活用しつつプライバシーを保護し、TRPOの効率的な探索能力を活用することで、スマートグリッドの課題に対して高い性能を発揮する。
具体的には、個別の建物の特性を捉えるための個別エンコーディング部と、建物間の特徴の相互関係を学習する共有部から成るモデル構造を採用している。これにより、未知のデータ分布に対しても高い一般化性能を発揮する。
実験では、訓練データと評価データの分布を意図的に変化させ、提案手法の一般化性能を検証している。その結果、提案手法が最適な性能に近づくことを示している。
統計
各建物の非シフト可能な負荷と太陽光発電は、温度、湿度、建物固有のベースパターンの非線形関数として表現されている。
訓練時と評価時では、温度と湿度のデータ範囲を意図的に変化させている。これにより、提案手法の一般化性能を検証している。