Conceptos Básicos
集中型と分散型のマルチエージェント強化学習アプローチを提案し、電気自動車充電ネットワークの効率性、スケーラビリティ、公平性を向上させる。
Resumen
本論文では、電気自動車(EV)の急速な普及に伴う電力需要の増加に対処するため、集中型と分散型のマルチエージェント強化学習(MARL)アプローチを提案している。
まず、EV充電ネットワークを部分観測マルコフ決定過程(Dec-POMDP)としてモデル化し、各EV充電器をエージェントとして定義する。次に、集中型の評価関数を持つCTDE-DDPGと、分散型の評価関数を持つI-DDPGの2つのMARL手法を提案する。
理論的な分析では、両手法の期待値は等しいが、CTDE-DDPGの方が政策勾配の分散が大きいことを示す。一方、数値実験の結果、CTDE-DDPGはI-DDPGに比べて、充電総変動を約36%、充電コストを約9.1%削減できることを明らかにしている。これは、CTDE-DDPGが訓練時に協調的な行動を学習することで、動的な電力価格に対して効果的に対応できるためである。さらに、エージェント数が増加するにつれ、CTDE-DDPGは充電制御の公平性と堅牢性を向上させることが示された。
Estadísticas
充電総変動を約36%削減
充電コストを約9.1%削減
Citas
"集中型と分散型のマルチエージェント強化学習アプローチを提案し、電気自動車充電ネットワークの効率性、スケーラビリティ、公平性を向上させる。"
"CTDE-DDPGはI-DDPGに比べて、充電総変動を約36%、充電コストを約9.1%削減できる。"
"エージェント数が増加するにつれ、CTDE-DDPGは充電制御の公平性と堅牢性を向上させる。"