Core Concepts
부분적인 그리드 관측성 하에서 강화 학습을 통해 전력 제한 수준을 직접 결정하는 새로운 접근법을 제시한다.
Abstract
이 논문은 부분적인 그리드 관측성 하에서 강화 학습을 활용하여 전력 제한 수준을 직접 결정하는 새로운 접근법을 소개한다.
데이터 생성 단계에서는 다양한 그리드 운영 상태를 모델링하고, 유연한 자산에서의 제한 결정을 매핑한다. 관측 가능한 버스에서의 측정치를 입력으로 받는 강화 학습 에이전트가 최적의 유효 및 무효 전력 설정점을 학습한다.
실제 저압 그리드 데이터를 활용한 실험 결과, 제안된 방법이 전압 밴드 위반의 100%와 자산 과부하의 98.8%를 해결할 수 있음을 보여준다. 또한 기존 최적 전력 흐름 솔버에 비해 훨씬 빠른 추론 속도를 달성한다.
이 접근법은 부분적인 관측성을 고려하여 실시간 그리드 운영에 적용할 수 있는 효율적인 의사결정 모델을 제공한다.
Stats
테스트 데이터셋(20,453개 공급 과제)에서 총 7,041건의 위반이 발생했으며, 이 중 99.7%가 해결되었다.
상위 전압 밴드 위반은 5,384건이었고, 100% 해결되었다.
하위 전압 밴드 위반은 424건이었고, 100% 해결되었다.
자산 과부하는 6,617건이었고, 98.8%가 해결되었다.
Quotes
"부분적인 그리드 관측성 하에서 강화 학습을 활용하여 전력 제한 수준을 직접 결정하는 새로운 접근법을 소개한다."
"실제 저압 그리드 데이터를 활용한 실험 결과, 제안된 방법이 전압 밴드 위반의 100%와 자산 과부하의 98.8%를 해결할 수 있음을 보여준다."
"이 접근법은 부분적인 관측성을 고려하여 실시간 그리드 운영에 적용할 수 있는 효율적인 의사결정 모델을 제공한다."