Основные понятия
提案された方法は、説明可能な決定木を使用してRLベースの制御ポリシーを獲得し、満足できる制御性能と説明可能性を達成します。
Аннотация
需要側の柔軟性がエネルギー転換プロセスで重要性を増している。
データ駆動型制御フレームワークに基づく新しい手法が提案されており、説明可能なRLポリシーを取得することが目的。
DDTを使用したポリシーディスティレーションアプローチにより、単純で説明可能な制御ポリシーが学習されます。
実証実験では、DDTによる制御ポリシーがRBCよりも優れたパフォーマンスを示しました。
DDTは教師DQNエージェントのパフォーマンスと比較して満足のいく結果を達成しました。
Introduction:
Demand-side flexibility is crucial in the energy transition process.
Proposed method aims to obtain explainable RL-based control policies using differentiable decision trees.
Methodology:
Differentiable Decision Trees (DDTs) are used for policy distillation.
Training setup involves training teacher agent with DQN and then distilling knowledge to train student DDT.
Results:
Performance evaluation showed that DDTs outperformed baseline RBC controller.
Explainability comparison demonstrated that DDT policies were more intuitive than DQN policies.
Статистика
データ効率性の問題や深層ニューラルネットワークに基づく場合の不透明性に対処するために、異なる意思決定木を使用することが提案されています。