Belangrijkste concepten
모델 기반 딥 강화 학습과 모방 학습을 결합한 하이브리드 에이전트 아키텍처를 통해 샘플 효율성 향상 및 재앙적 망각 문제 해결
Samenvatting
이 논문은 모델 기반 딥 강화 학습과 모방 학습을 결합한 하이브리드 에이전트 아키텍처를 제안한다.
주요 내용은 다음과 같다:
모델 기반 딥 강화 학습 알고리즘인 SAC와 기존 전압 제어기를 병행 사용하는 하이브리드 에이전트 구조 소개
에이전트의 성능 함수와 판별기 메커니즘을 통해 두 정책 간 선택
CIGRE 중압 기준 전력망에서의 사례 연구 결과 제시
순수 SAC 에이전트와 비교하여 하이브리드 에이전트가 더 빠른 학습과 안정적인 성능을 보임
이를 통해 모델 기반 학습과 모방 학습을 결합한 접근법이 샘플 효율성 향상과 재앙적 망각 문제 해결에 효과적임을 확인할 수 있다.
Statistieken
전압 제어기 기반 정책의 업데이트 공식: q(t+1) = [q(t) - D(V(t) - 1)]+
에이전트의 성능 함수: PΩ(m(t)) = α·GΩ(x=m(t)/|V|) + β·GΩ(x=ΨΩ(m(t)/|V|)) + γ·(Σb r ΨΩ(m(t)/|V|)b)·(m(t)/|V| - Σb d-1)-1