本研究では、ShapeGraspと呼ばれる新しいアプローチを提案している。ShapeGraspは、物体の幾何学的特徴を分解し、基本的な幾何学形状のグラフ構造で表現する。その上で、大言語モデルを用いて各部品の意味的な解釈と、タスクに適した部品の選択を行う。
具体的には以下の手順で動作する:
この一連の処理により、ゼロショットでタスク指向型の把握を実現している。実験では、従来手法と比較して高い把握成功率を示している。また、物体の形状情報とタスクの関係性を大言語モデルが推論する過程を分析し、その有効性を示している。
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Samuel Li,Sa... at arxiv.org 03-28-2024
https://arxiv.org/pdf/2403.18062.pdfDeeper Inquiries