Core Concepts
建設現場での人間-ロボット協調作業を支援するために、音声コマンドと手持ちコントローラーの入力を統合した多様なインターフェースシステムを提案する。このシステムは、ビルディング情報モデリング(BIM)、ロボット制御システム(ROS)、そして大規模言語モデル(GPT-4)を統合することで、直感的で効率的なコミュニケーションを実現する。
Abstract
本研究では、建設現場での人間-ロボット協調作業を支援するための多様なインターフェースシステムを提案している。このシステムは、音声コマンドと手持ちコントローラーの入力を統合することで、直感的で効率的なコミュニケーションを実現する。
具体的には以下の通りである:
音声入力と手持ちコントローラーの入力を統合し、ビルディング情報モデリング(BIM)のデータを活用することで、作業対象物の選択と指示を効率的に行うことができる。
大規模言語モデル(GPT-4)を活用したチャットシステムを導入し、人間オペレーターとロボットの双方向コミュニケーションを可能にする。このシステムは、人間オペレーターの指示を正確に理解し、必要に応じて確認を求めることで、作業の正確性を高める。
ロボット制御システム(ROS)と統合することで、仮想空間内のロボットの動作を実現する。
12人の建設作業者を対象とした実験では、提案システムの低い作業負荷と高い使いやすさが確認された。また、参加者の2/3が音声入力とコントローラー入力を組み合わせた多様なインターフェースを好んだ。チャットシステムは92.73%の高い精度で作業指示の誤りを検出することができた。
これらの結果は、建設現場における人間-ロボット協調作業を支援するための多様なインターフェースシステムの有効性を示している。AI支援によるコミュニケーションの効率化と正確性の向上は、建設作業の生産性向上に大きく寄与すると期待される。
Stats
音声コマンドは平均8.27単語、最長19単語、最短5単語であった。
多様なインターフェースによるコマンドは平均6.65単語、最長18単語、最短3単語であった。
チャットシステムは55件の意図的な誤指示のうち51件(92.73%)を正しく検出した。
Quotes
"音声入力のほうが速いと感じた。"
"多様なインターフェースのほうが効率的で早いと感じた。"
"物を指して指示できるのは使いやすかった。"