複雑で混沌とした状況下での時空間アクション検出の性能を向上させるため、SlowFast と ViT の特徴抽出能力を融合したSFMViTモデルを提案した。さらに、アンカーの最適化を行うConfidence Pruning Strategyを導入し、モデルの精度と効率を高めた。