核心概念
ロボットが人間の軌跡を予測し、人間の視覚フィードバックに基づいて経路を動的に修正することで、協調的な環境における信頼できる双方向的な人間-ロボット相互作用を促進する。
要約
本研究は、社会ロボットナビゲーションのための包括的なエンドツーエンドフレームワークを提案する。このフレームワークにより、モバイルロボットは人々の軌跡を予測し、社会的に適切な方法で経路を調整することができる。人間とロボットの決定が対立する場合、視覚的な確認を通じて検出され、人間の好みに基づいて経路が動的に変更される。同時に、音声コミュニケーションを維持することで、信頼関係の構築を目指す。
提案システムの主な構成要素は以下の通りである:
グラフ注意ネットワーク(GAT)ベースの軌跡予測モジュール: 個人間の関係性とコンテキストを学習し、任意の人数の軌跡を同時に予測する。
信頼性AIモジュール: 予測された軌跡と人間からの視覚フィードバックを考慮して、ロボットの決定を正当化し、人間とのコミュニケーションを維持する。
双方向的な人間-ロボット対話: ロボットは人間の手話ジェスチャーを認識し、経路変更の理由を音声で説明する。
本研究では、人間検出・追跡、手話ジェスチャー認識、軌跡予測の各コンポーネントについて、予備実験の結果を示している。今後は、提案システム全体の統合と、実際の工場環境でのデータ収集・検証を行う予定である。
統計
ロボットは人間の現在位置ではなく、予測された将来の軌跡を障害物として扱う。
ロボットは人間の手話ジェスチャーを5つのクラス('待機'、'左へ'、'右へ'、'続行'、'不明')に分類する。