Advancing open-vocabulary 3D scene understanding through innovative methods and challenges.
提案手法BBQは、3Dシーングラフ表現と大規模言語モデルを組み合わせることで、複雑な自然言語クエリに基づいて3Dシーン内のオブジェクトを正確に特定することができる。