Concetti Chiave
身体的意思決定においては、未知の環境や曖昧な指示に直面した際、言語モデルが必要な情報を積極的に収集することが重要である。
Sintesi
本論文では、身体的意思決定における新しい枠組みとして「人間/外部情報源を含むContextual MDP」を提案している。この枠組みでは、エージェントが自然言語を用いて外部情報源から必要な情報を積極的に収集することができる。
具体的には以下の3点が主な内容となっている:
「Asking Before Acting (ABA)」という手法を提案し、言語モデルがどのように必要な情報を効率的に収集できるかを示している。ABAでは、状況に応じて適切な質問を生成し、得られた情報を意思決定に活用する。
ABAをさらに発展させた「ABA-FT」を提案している。ABA-FTでは、質問の生成と回答の理解を一体化した学習を行うことで、より効果的な情報収集を実現している。
様々な環境(テキストベースの日常タスク、ロボットアーム操作タスク、実世界のオープンドメインタスク)でABAとABA-FTの有効性を実証的に示している。特に実世界のオープンドメインタスクでは、ABAが自然言語による質問生成と情報収集を行えることを定性的に示している。
以上のように、本論文では身体的意思決定における言語モデルの活用を提案し、その有効性を実証的に示している。
Statistiche
未知の環境や曖昧な指示に直面した際、言語モデルが単独で適切な行動を取ることは困難である。
人間のように、必要な情報を積極的に収集することが重要である。
ABAを用いることで、効率的な情報収集と高い性能を実現できる。
ABA-FTではさらに性能が向上し、特に長期的なタスクでの優位性が示された。
Citazioni
"When confronted with such scenarios, we humans typically adopt a different approach. When assigned with ambiguous tasks, it is more prudent to ask for clarification about the task before taking actions, ensuring we have the tasks correctly understood."
"Besides, rather than resorting to onerous trial and error, it is natural for us to actively query external information from our peers to accelerate information gathering and guide decision making."