본 연구는 개방형 3D 장면 그래프 예측을 위한 새로운 접근법을 제안한다. 기존 방법들은 고정된 객체 클래스와 관계 범주에 의존하는 반면, 본 연구는 레이블된 장면 그래프 데이터 없이도 3D 점 구름에서 개방형 3D 장면 그래프를 학습할 수 있다.
핵심 아이디어는 강력한 개방형 2D 비전-언어 기반 모델의 특징을 3D 그래프 신경망에 증류하는 것이다. 이를 통해 개방형 객체 클래스와 개방형 관계를 예측할 수 있다.
구체적으로 다음과 같은 과정을 거친다:
실험 결과, 본 방법은 고정 어휘 벤치마크에서 기존 감독 학습 방법과 경쟁력 있는 성능을 보였다. 또한 드문 객체 클래스에 대해서도 강건한 성능을 보였다.
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Sebastian Ko... a las arxiv.org 04-02-2024
https://arxiv.org/pdf/2402.12259.pdfConsultas más profundas