Основные понятия
Adding noise to correct skewed error distributions improves sample efficiency and performance in RL.
Статистика
ベルマンエラーの分布はGumbel分布に従うことが示唆されている。
SymREDQでは、アンサンブルサイズを20に増やして分散を減らす。
Цитаты
"The proposed method adds noise that cancels out the distortion in the error, making it closer to a normal distribution."
"In online RL, not much improvement is observed with Gumbel regression due to its instability."