본 연구는 개방형 3D 장면 그래프 예측을 위한 새로운 접근법을 제안한다. 기존 방법들은 고정된 객체 클래스와 관계 범주에 의존하는 반면, 본 연구는 레이블된 장면 그래프 데이터 없이도 3D 점 구름에서 개방형 3D 장면 그래프를 학습할 수 있다.
핵심 아이디어는 강력한 개방형 2D 비전-언어 기반 모델의 특징을 3D 그래프 신경망에 증류하는 것이다. 이를 통해 개방형 객체 클래스와 개방형 관계를 예측할 수 있다.
구체적으로 다음과 같은 과정을 거친다:
실험 결과, 본 방법은 고정 어휘 벤치마크에서 기존 감독 학습 방법과 경쟁력 있는 성능을 보였다. 또한 드문 객체 클래스에 대해서도 강건한 성능을 보였다.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Sebastian Ko... at arxiv.org 04-02-2024
https://arxiv.org/pdf/2402.12259.pdfDeeper Inquiries