核心概念
電力価格の変動を利用したバッテリー蓄電によるエネルギー裁定において、深層強化学習(DRL)と時系列予測を組み合わせることで、予測誤差が大きい場合でも収益を大幅に向上できる。
要約
深層強化学習と時系列予測を用いたバッテリー蓄電によるエネルギー裁定の強化
本論文は、深層強化学習(DRL)と時系列予測を組み合わせることで、バッテリー蓄電によるエネルギー裁定の収益性を向上させる手法を提案している。
電力価格の変動を利用したバッテリー蓄電によるエネルギー裁定において、DRLエージェントに将来の電力価格に関する情報を提供することで、より収益性の高い制御ポリシーを学習させることを目的とする。
カナダ・アルバータ州の電力価格データを用いて、バッテリー蓄電によるエネルギー裁定の環境をモデル化する。
DRLエージェントとして、Deep Q-Network (DQN) と Proximal Policy Optimization (PPO) を用いる。
時系列予測モデルとして、CNN、LSTM、CNN-LSTMハイブリッド、Attention機構付きCNN-LSTMハイブリッドの4種類の深層学習アーキテクチャを評価する。
予測された電力価格をDRLエージェントの状態空間に入力し、制御ポリシーの学習を行う。
予測の有無、予測期間、予測モデルの種類によるDRLエージェントのパフォーマンスを比較評価する。