3D言語ガウシアンスプラッティング:効率的で正確な3D言語フィールドの構築
本論文は、3D言語フィールドを効率的かつ正確に構築するための新しい手法「3D言語ガウシアンスプラッティング(LangSplat)」を提案する。LangSplatは、3DガウシアンスプラッティングをベースとしてCLIPの言語特徴を組み込み、シーン固有の言語オートエンコーダを導入することで、従来手法よりも高速かつ精度の高い3D言語フィールドを実現する。また、セグメントエニシングモデル(SAM)を活用して言語特徴の階層的セマンティクスを学習することで、物体境界の曖昧さを解消している。