에너지 기반 정책은 복잡하고 다중 모드 행동을 모델링하는 유연한 프레임워크를 제공하지만, 연속 행동 공간에서 이러한 정책에서 직접 샘플링하는 것은 계산적으로 어렵다. 이 논문에서는 확산 기반 접근법을 사용하여 에너지 기반 정책에서 샘플링하는 방법을 제안한다.