核心概念
大規模言語モデル(LLM)と意味マッピングを統合することで、動的な環境においてもロボットが複雑なタスクを理解し、実行できるようにする、適応性の高いロボット行動計画のための新しいアーキテクチャが提案されています。
要約
すべてを統治するもの:コミュニケーション、知覚、行動を結びつける自然言語
Colombani, S., Ognibene, D., & Boccignone, G. (2024). One to rule them all: natural language to bind communication, perception and action. In Proceedings of the International Workshop on Artificial Intelligence for Climate Change, the Italian workshop on Planning and Scheduling, the RCRA Workshop on Experimental evaluation of algorithms for solving problems with combinatorial explosion, and the Workshop on Strategies, Prediction, Interaction, and Reasoning in Italy (AI4CC-IPS-RCRA-SPIRIT 2024), co-located with 23rd International Conference of the Italian Association for Artificial Intelligence (AIxIA 2024) (pp. 1–10). CEUR-WS.org.
本研究は、動的で多様な環境において、人間の指示を理解し、タスクを実行できるロボットを実現するために、コミュニケーション、知覚、計画を大規模言語モデル(LLM)と統合した高度なロボット行動計画アーキテクチャを提案することを目的としています。