Основні поняття
深層強化学習を用いて、森林環境における最適な防火帯の配置を学習することで、効果的な森林火災予防を実現する。
Анотація
本研究では、深層強化学習を用いて、森林環境における最適な防火帯の配置を学習する手法を提案している。具体的には以下の通りである:
- 深層Q学習、Double Deep Q学習、Dueling Double Deep Q学習などの深層強化学習アルゴリズムを適用し、防火帯配置の最適化を行う。
- 火災拡散シミュレータCell2Fireと畳み込みニューラルネットワークを組み合わせ、防火帯配置を学習する計算エージェントを実装する。
- 発見的アルゴリズムに基づくプレトレーニングを行い、その性能を上回る結果を得ることができた。
- 40x40セルの大規模な問題インスタンスでも良好な収束性を示し、この分野への深層強化学習の適用可能性を示した。
- 本研究は、防火帯配置問題に対する深層強化学習の先駆的な取り組みであり、火災予防と景観管理における有望な展望を示している。
Статистика
無処理の状態では、Sub20の18%、Sub40の31%の森林が焼失する。
深層強化学習アルゴリズムを適用した結果、Sub20では11.31%から12.86%、Sub40では21.55%から21.78%の焼失率に抑えられた。
ランダムアルゴリズムでは、Sub20が16.1%、Sub40が28.36%の焼失率であった。
ベースラインアルゴリズムでは、Sub20が12.9%、Sub40が23.25%の焼失率であった。