核心概念
本研究では、過去の観測を活用して複雑な環境でも効果的にナビゲーションできる分散型差分メモリ付きマルチロボットアーキテクチャ(D2M2N)を提案する。D2M2Nは圧縮された環境表現を維持し、Value Iteration Networkを用いて最適な行動を選択する。
要約
本研究では、複数ロボットによる経路計画問題を扱う。各ロボットは部分的な観測しかできず、通信範囲内の他ロボットとのメッセージ交換によって環境の情報を共有する。
D2M2Nのメモリ維持モジュールは、各ロボットの過去の観測と受信メッセージを統合して圧縮された環境表現を更新する。Value Iteration Networkモジュールは、この圧縮表現と現在位置、目標位置を入力として最適な行動を選択する。
D2M2Nは、従来のメモリレスなモデルと比べて、特に複雑な環境でナビゲーション性能が大幅に向上する。実験結果では、D2M2Nが既存手法に比べて5%から30%の精度向上を示した。また、センサノイズや複数目標への拡張にも対応できることを確認した。
統計
単一ロボットの完全観測下ナビゲーションタスクでは、D2M2Nの成功重み付き逆経路長(SPL)が、MAGAT手法に比べて12x12環境で0.97対0.85、24x24環境で0.74対0.64となった。
複数ロボットの部分観測下ナビゲーションタスクでは、D2M2NのスコアがMAGATの5倍以上高かった。
引用
"D2M2Nは、過去の観測を活用し、Value Iteration Networkを用いることで、特に複雑な環境でナビゲーション性能が大幅に向上する。"
"D2M2Nは、センサノイズや複数目標への拡張にも対応できることを実験で確認した。"