核心概念
本稿では、曖昧な指示文を用いた視覚と言語ナビゲーションにおいて、経路と指示文間の位置合わせに着目することで、エージェントが情報不足を認識し、適切なタイミングで支援を求める手法を提案する。
要約
視覚と言語ナビゲーションにおける情報欠如の検出:尋ねるべきか、尋ねざるべきか?
本稿は、視覚と言語ナビゲーション(VLN)タスクにおける、曖昧な指示文から生じる不確実性に対処するための新しい手法を提案する研究論文である。
Savitha Sam Abraham, Sourav Garg, Feras Dayoub. (2024). To Ask or Not to Ask? Detecting Absence of Information in Vision and Language Navigation. arXiv preprint arXiv:2411.05831v1.
本研究の目的は、VLNエージェントが、特に曖昧な指示文が与えられた場合に、情報不足を認識し、適切なタイミングで支援を求めることができるようにすることである。