Core Concepts
CUE-Netは、空間クロッピング、強化UniformerV2アーキテクチャ、および改良型効率的付加注意機構を組み合わせた新しいアプローチで、ビデオ内の暴力検知を高精度かつ効率的に行う。
Abstract
本論文では、CUE-Netと呼ばれる新しいアーキテクチャを提案している。CUE-Netは以下の特徴を持つ:
空間クロッピング: 人物検出アルゴリズムを使って、ビデオ内の人物領域を特定し、その領域を中心に空間的にクロッピングすることで、重要な情報を保持しつつ、効率的に処理を行う。
強化UniformerV2: 畳み込みと自己注意機構の利点を組み合わせた強化UniformerV2アーキテクチャを採用し、局所的および大域的な時空間特徴を効果的にモデル化する。
改良型効率的付加注意機構(MEAA): 従来の自己注意機構の計算量を削減した新しい注意機構を導入し、大域的な時空間特徴を効率的に抽出する。
実験の結果、CUE-Netは、RWF-2000およびRLVSデータセットにおいて、最新の手法を上回る精度を達成し、新しい最高精度を記録した。特に、空間クロッピングとMEAAの導入が精度向上に大きく寄与していることが示された。
Stats
監視カメラの普及と低コスト化により、膨大な量のビデオデータを効率的に監視する必要性が高まっている。
暴力検知は、人物が遠くにいたり部分的に隠れている場合など、従来の課題に直面している。
局所的および大域的な時空間特徴を効果的にモデル化することが重要である。
Quotes
"CUE-Netは、空間クロッピング、強化UniformerV2アーキテクチャ、および改良型効率的付加注意機構を組み合わせた新しいアプローチで、ビデオ内の暴力検知を高精度かつ効率的に行う。"
"実験の結果、CUE-Netは、RWF-2000およびRLVSデータセットにおいて、最新の手法を上回る精度を達成し、新しい最高精度を記録した。"