Core Concepts
2D 스켈레톤 히트맵을 입력으로 사용하고 TCN을 통해 시공간 특징을 추출하는 새로운 액션 세그멘테이션 방법을 제안한다. 또한 2D 스켈레톤 히트맵과 RGB 비디오를 융합하여 성능을 향상시킨다.
Abstract
이 논문은 2D 스켈레톤 기반 액션 세그멘테이션 방법을 제안한다. 기존 방법들은 3D 스켈레톤 좌표를 입력으로 사용하고 GCN을 통해 시공간 특징을 추출했지만, 제안 방법은 2D 스켈레톤 히트맵을 입력으로 사용하고 TCN을 통해 시공간 특징을 추출한다. 이를 통해 3D 정보가 없어도 기존 방법과 유사하거나 더 나은 성능을 달성할 수 있으며, 키포인트 누락에 대한 강건성도 높다. 또한 2D 스켈레톤 히트맵과 RGB 비디오를 융합하여 성능을 더욱 향상시킨다. 이는 2D 스켈레톤 히트맵 입력과 2D 스켈레톤-RGB 융합을 액션 세그멘테이션에 처음 적용한 것이다.
실험 결과, 제안 방법은 UW-IOM, TUM-Kitchen, Desktop Assembly 데이터셋에서 기존 방법들을 능가하는 성능을 보였다. 특히 키포인트 누락에 대한 강건성이 높은 것으로 나타났다.
Stats
키포인트 누락 확률 100%일 때 제안 방법의 F1 스코어 감소율은 2.54%에 불과하지만, MS-GCN과 STL은 각각 3.88%와 6.99% 감소했다.
키포인트 누락 확률 25%와 50%에서도 제안 방법의 F1 스코어는 안정적으로 유지되었지만, MS-GCN과 STL은 최대 2.60%와 2.95% 감소했다.
Quotes
"제안 방법은 3D 정보가 없어도 기존 방법과 유사하거나 더 나은 성능을 달성할 수 있으며, 키포인트 누락에 대한 강건성도 높다."
"2D 스켈레톤 히트맵과 RGB 비디오를 융합하여 성능을 더욱 향상시킨다."