核心概念
プロシューマーが太陽光発電と蓄電池を所有し、動的な電力市場の中で利益を最大化する問題に対して、プロキシマル・ポリシー最適化(PPO)を用いた強化学習フレームワークを提案する。
要約
本研究では、プロシューマーが太陽光発電と蓄電池を所有し、動的な電力市場の中で利益を最大化する問題に取り組んでいる。
プロシューマーは、再生可能エネルギー源と蓄電池を持ち、市場情報に基づいて電力の買い取りと売却を決定する。
提案するフレームワークは、プロキシマル・ポリシー最適化(PPO)を用いた強化学習モデルで構成される。
PPOモデルは、過去の報酬情報を観測に含めることで、長期的な視点から最適な行動を学習する。
提案手法は、単純な売却アルゴリズムや時系列予測モデルと比較して、30%以上の利益向上を達成した。
データ拡張手法として、ソリトン波に基づく埋め込みを提案し、通常の埋め込みよりも良好な一般化性能を示した。
統計
発電量(Watt) = 電圧(Vmp) × 電流(Imp)