核心概念
ニューラルパスプランナーにバックドアを注入することで、わずかな環境の変化によって意図しない動作を引き起こすことができる。
要約
本論文では、ニューラルパスプランナーにバックドアを注入する新しい手法を提案している。具体的には以下の通りである:
バックドアの動作を記述するための文法を定義し、微分可能な意味論を導入した。これにより、バックドアの目的を柔軟に指定できる。
2つのアプローチでバックドアを注入した。1つは微分可能な意味論を利用して直接モデルに注入する方法、もう1つはデータセットを汚染する方法である。
注入したバックドアは、わずかな環境の変化によって高い成功率で引き起こすことができ、ニューラルパスプランナーの性能にも大きな影響を与えないことを示した。
バックドアの除去は困難であり、単純な微調整では効果的ではないことを示した。一方で、バックドアの目的が既知であれば、トリガー反転手法によって効果的に検出できることを示した。
本研究は、ニューラルパスプランナーの安全性と信頼性に関する重要な問題を提起している。今後の課題として、より高次元の構成空間でのバックドアの注入と防御が挙げられる。
統計
ニューラルパスプランナーの平均パス長の増加は2.99%以内であり、探索ステップの増加は4.62%以内であった。