핵심 개념
GCNにおける骨格トポロジーの重要性と、新しい手法であるTopological Invariance EncodingとBlockGCの効果的な組み合わせにより、パフォーマンスが向上することを示す。
초록
人間の関節動作を解析するために使用されるGraph Convolutional Networks(GCNs)は、骨格ベースのアクション認識において最先端を定義してきました。しかし、これらの切り口が直面している問題点が浮かび上がっています。本研究では、GCNにおける骨格トポロジーの重要性とその学習中に失われる問題、「Catastrophic Forgetting」と呼ばれる現象に焦点を当てています。また、新しい手法であるTopological Invariance EncodingとBlockGCを導入することで、これらの問題点を解決し、パラメータ数や学習時間を削減しつつ性能向上を達成しています。
통계
骨格ベースアクション認識におけるNTU RGB+D 120データセットで89.7%の精度を達成。
BlockGCはパラメータ数を約半分削減しつつ平均0.5%以上の改善。
Topological Invariance Encodingは学習中に過学習問題を軽減。
인용구
"Graph Convolutional Networks (GCNs) have long defined the state-of-the-art in skeleton-based action recognition."
"Our proposed contributions allow us to significantly reduce the number of model parameters and the training time."
"Our BlockGC substantially reduces the parameters by 0.9M, while simultaneously improving over the vanilla GC."