深層強化学習における探索の一般的な方法として、NoisyNetは問題固有の探索戦略を生成できる。しかし、バイナリ発火メカニズムを持つSNNは、ローカルな摂動に対して強い頑健性を持ち、パラメトリックノイズに基づく探索に大きな挑戦をもたらす。そこで、時間相関ノイズを導入することで効果的な探索手法を提案し、エージェントが十分な探索後に安定したポリシーを見つけるためのノイズ削減方法も提案されている。実験結果は、この手法がOpenAI gymの幅広い連続制御タスクで最先端のパフォーマンスを上回っていることを示している。
Ke Bahasa Lain
dari konten sumber
arxiv.org
Wawasan Utama Disaring Dari
by Ding Chen,Pe... pada arxiv.org 03-08-2024
https://arxiv.org/pdf/2403.04162.pdfPertanyaan yang Lebih Dalam