Grunnleggende konsepter
DOrAは、Order-Aware referringを活用した3Dビジュアルグラウンディングフレームワークであり、大規模言語モデルを使用して入力記述からアンカー/ターゲットオブジェクトを特定し、関連するオブジェクトの機能を進歩的に更新します。
Statistikk
"Experimental results on the NR3D and ScanRefer datasets demonstrate our superiority in both low-resource and full-data scenarios."
"DOrA surpasses current state-of-the-art frameworks by 9.3% and 7.8% grounding accuracy under 1% data and 10% data settings, respectively."