제안된 2CH-TR 모델은 관찰된 짧은 동작 시퀀스(400ms)에서 시공간 정보를 효율적으로 활용하여 단기 및 장기 3D 인간 동작 예측에서 경쟁력 있는 정확도를 달성합니다. 또한 2CH-TR은 Transformer의 효율적인 성능으로 인해 경량화되어 있어 경쟁 모델보다 빠릅니다.
본 연구는 시각 기반 모델을 활용하여 투명 물체의 표면 밀도를 추정하고 이를 통해 신경 방사 필드 기반 깊이 완성 성능을 향상시킨다.
임베딩 포즈 그래프(EPG)는 기반 모델의 장점과 로봇 응용 프로그램에 적합한 간단한 3D 표현을 결합한 혁신적인 방법입니다. EPG는 로봇이 복잡한 공간을 효율적으로 이해하고 탐색할 수 있도록 지원합니다.