Konsep Inti
既存のVLNエージェントの汎化能力を向上させ、実世界での逸脱に耐えるためにPROPERトレーニングパラダイムが開発されました。
Abstrak
この記事では、Vision-and-language navigation(VLN)エージェントが実世界でのナビゲーションシーンに適応するために、新しいトレーニングパラダイムであるPROPERが提案されています。PROPERは、逸脱耐性を向上させ、ルート逸脱後も正確なナビゲーションを行うことを目指しています。具体的には、摂動感知対照学習メカニズムが導入されており、異なるシナリオ下でのポジティブ/ネガティブ関係を学ぶことでロバストなアクション決定を可能にしています。
Statistik
PROPERはState-of-the-art VLNベースラインに利益をもたらす。
PP-R2Rデータセットは一般的なVLNエージェントのロバスト性を示す。
PROPERは摂動フリーなシナリオでも効果的である。
Kutipan
"Can we improve the generalization ability of existing VLN agents towards real-world scenarios by simply requiring them to learn successful navigation under the unexpected route deviation?"
"Inspired by this, we consider: Can we improve the generalization ability of existing VLN agents towards real-world scenarios by simply requiring them to learn successful navigation under the unexpected route deviation?"
"To enhance the deviation-robustness of the agent, a straightforward solution is to impose the perturbation into different trajectory instances directly."