본 연구는 3D 포인트 클라우드 이해를 위한 새로운 문맥 학습 프레임워크 Point-In-Context(PIC)를 제안한다. PIC는 기존 2D 이미지 문맥 학습 방식을 3D 포인트 클라우드에 확장하여, 다양한 3D 포인트 클라우드 작업을 단일 모델로 처리할 수 있다.
PIC-G(Point-In-Context-Generalist)는 3D 포인트 클라우드 다중 작업 학습을 위한 기본 모델이다. PIC-G는 마스크 포인트 모델링(MPM) 프레임워크를 활용하여 입력 포인트 클라우드와 타겟 포인트 클라우드 간의 관계를 학습한다. 이를 위해 Joint Sampling 모듈을 제안하여 입력과 타겟 포인트 클라우드의 일관성을 유지한다.
PIC-S(Point-In-Context-Segmenter)는 부분 분할 작업에 특화된 모델이다. PIC-S는 In-Context Labeling과 In-Context Enhancing 전략을 통해 성능과 일반화 능력을 향상시킨다. In-Context Labeling은 고정된 레이블 좌표 대신 동적 문맥 레이블을 사용하여 다양한 데이터셋에 적용할 수 있도록 한다. In-Context Enhancing은 다양한 데이터 증강 기법을 활용하여 모델의 강건성을 높인다.
실험 결과, PIC-S는 기존 모델 대비 우수한 성능을 보이며, 특히 새로운 데이터셋에 대한 일반화 능력이 뛰어난 것으로 나타났다. 이를 통해 PIC가 실제 응용 분야에서 활용될 수 있음을 보여준다.
Vers une autre langue
à partir du contenu source
arxiv.org
Questions plus approfondies