Core Concepts
본 연구는 합성 데이터와 실제 데이터 간의 도메인 격차를 해소하기 위한 새로운 접근법을 제안한다. 제안하는 방법은 동적 장면, 즉 움직이는 물체나 인간 행동이 있는 장면에서 자세 또는 행동을 인식하는 것을 목표로 한다. K-Planes 신경 방사 필드(NeRF)의 확장인 계층적 K-Planes(TK-Planes)를 제안하여, 장면의 개념 정보와 출력 특징 맵을 RGB 이미지로 변환하는 이미지 디코더를 효과적으로 모델링한다.
Abstract
본 연구는 합성 데이터와 실제 데이터 간의 도메인 격차를 해소하기 위한 새로운 접근법을 제안한다. 제안하는 TK-Planes 알고리즘은 K-Planes NeRF의 확장으로, 계층적 특징 벡터를 저장하고 처리한다.
TK-Planes의 주요 특징은 다음과 같다:
장면의 개념 정보와 이미지 디코더를 효과적으로 모델링
정적 및 동적 객체 간의 정보를 활용하여 고고도 비디오의 두드러진 장면 속성을 포착
Okutama Action과 UG2와 같은 어려운 데이터셋에서 우수한 성능 달성
실험 결과, TK-Planes는 기존의 K-Planes와 Extended K-Planes 대비 동적 장면의 렌더링 품질을 크게 향상시켰다. 이는 객체 탐지, 자세 인식, 행동 인식 등의 작업에 도움이 될 것으로 기대된다.
Stats
정적 및 동적 객체 간의 코사인 유사도 손실 함수를 사용하여 특징 벡터를 분리
각 특징 벡터의 차원을 점진적으로 줄여 이미지 디코더와 효과적으로 통합
Quotes
"본 연구는 합성 데이터와 실제 데이터 간의 도메인 격차를 해소하기 위한 새로운 접근법을 제안한다."
"TK-Planes는 정적 및 동적 객체 간의 정보를 활용하여 고고도 비디오의 두드러진 장면 속성을 포착한다."