핵심 개념
플러그인 하이브리드 전기 자동차의 에너지 관리는 연속 및 이산 변수를 동시에 다루는 연속-이산 강화 학습을 기반으로 한 전략이 효과적임을 입증하였다.
초록
에너지 관리 전략은 연속 변수 및 이산 변수를 동시에 다루는 혼합 정수 프로그래밍 관점에서 제어 지향 모델을 수립하였다.
연속-이산 강화 학습을 기반으로 한 에너지 관리 전략은 고 및 저 SOC에서 최적의 에너지 절약 성능을 보여주었다.
CDRL 전략은 CD-CS 및 DP에 비해 에너지 효율성을 향상시키고, 시뮬레이션 결과에서 글로벌 최적해에 근접한 성능을 보여주었다.
PDQN-TD3 알고리즘은 혼합 행동 공간 문제를 효과적으로 해결하기 위해 제안되었으며, 목표 정책 부드럽게 만들기, 클리핑된 이중 Q-러닝, 지연된 정책 업데이트를 도입하였다.
통계
시뮬레이션 결과에 따르면, CDRL 전략은 고 SOC에서 에너지 효율성을 8.3% 향상시키고, DP에 비해 6.6% 낮은 에너지 소비를 보여주었다.
저 SOC에서는 에너지 효율성을 4.1% 향상시키고, DP에 비해 3.9% 낮은 에너지 소비를 보여주었다.
인용구
"에너지 관리 전략은 연속 변수와 이산 변수를 동시에 다루는 연속-이산 강화 학습을 기반으로 한 것이다."
"CDRL 전략은 혼합 정수 프로그래밍 방법의 계산 복잡성을 피하고 거의 최적의 에너지 관리를 제공한다."