連邦学習(FL)とTRPOを組み合わせたアプローチにより、スマートグリッドの課題に対して効果的な最適政策を学習することができる。個別の建物の特性を捉えつつ、建物間の特徴の相互関係を活用することで、未知のデータ分布に対しても高い一般化性能を発揮する。