본 연구는 3D 포인트 클라우드 이해를 위한 새로운 문맥 학습 프레임워크 Point-In-Context(PIC)를 제안한다. PIC는 다양한 3D 포인트 클라우드 작업을 단일 모델로 처리할 수 있으며, 특히 부분 분할 작업에서 향상된 성능과 일반화 능력을 보여준다.
제한된 레이블 정보를 효과적으로 활용하기 위해 레이블된 포인트에서 레이블되지 않은 포인트로 감독 신호를 밀집하게 전파하는 방법을 제안한다.
3D 포인트 클라우드 시퀀스에서 시간에 따라 변화하는 지역 패치(t-패치)를 추출하고, 이를 활용하여 정보적인 시공간 표현을 학습함으로써 향상된 3D 행동 인식 성능을 달성한다.
대규모 실제 세계 3D 스캔 데이터를 소수의 학습된 3D 프로토타입 모양으로 분해하는 무감독 딥러닝 방법을 제안한다.