本研究では、スポーツアクション認識の精度向上を目的として、「Cross-block Fine-grained Semantic Cascade (CFSC)」モジュールを提案している。CFSC モジュールは、GCNベースのバックボーンネットワークから抽出した異なる深さのブロックの特徴マップを段階的に統合することで、低レベルの細粒度な特徴を高レベルの特徴に効果的に融合する。
具体的には、まず複数のGCNブロックから特徴マップを抽出する。次に、浅いブロックから深いブロックへと特徴を段階的に統合する際に、時間畳み込みを適用して短期的な時間特徴を学習する。これにより、低レベルの細かい特徴が最終的な特徴表現に反映されるようになる。
提案手法は、既存のGCNベースのモデルに簡単に組み込めるプラグアンドプレイ型のモジュールである。実験では、自作の細粒度フェンシングデータセットFD-7と公開データセットFSD-10を用いて評価を行い、提案手法が従来手法を大きく上回る性能を示すことを確認した。
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Zhendong Liu... في arxiv.org 05-01-2024
https://arxiv.org/pdf/2404.19383.pdfاستفسارات أعمق