核心概念
FER-YOLO-Mambaモデルは、YOLOとMambaの原理を統合し、顔表情画像の効率的な認識と位置特定を実現する。
要約
本論文では、FER-YOLO-Mambaモデルを提案している。このモデルは、YOLOとMambaの原理を統合し、顔表情画像の効率的な認識と位置特定を実現する。
FER-YOLO-Mambaモデルの主な特徴は以下の通りである:
CNNの局所的な特徴抽出能力と状態空間モデル(SSM)の長距離依存関係の抽出能力を組み合わせた、FER-YOLO-VSS双分岐モジュールを開発した。
注意メカニズムと多層パーセプトロンを組み合わせ、重要な情報領域を強調し、関連性の低い領域の影響を抑えることで、モデルの識別性能を大幅に向上させた。
RAF-DBとSFEWの2つのベンチマークデータセットで実験を行った結果、提案モデルがほかのモデルよりも優れた性能を示した。
統計
提案モデルのRAF-DBデータセットにおけるmAPは80.31%であり、最新のYOLOvXモデルを1.91%上回った。
提案モデルのSFEWデータセットにおけるmAPは66.67%であり、YOLOvXモデルを2.65%上回った。
引用
"FER-YOLO-Mambaモデルは、YOLOとMambaの原理を統合し、顔表情画像の効率的な認識と位置特定を実現する。"
"FER-YOLO-VSS双分岐モジュールは、CNNの局所的な特徴抽出能力とSSMの長距離依存関係の抽出能力を組み合わせている。"
"注意メカニズムと多層パーセプトロンを組み合わせることで、重要な情報領域を強調し、関連性の低い領域の影響を抑えることができる。"