Core Concepts
MovePoseは、CPU搭載のモバイルデバイスでも実時間で高精度な人体姿勢推定を可能にする最適化された軽量畳み込みニューラルネットワークです。
Abstract
本論文では、MovePoseアルゴリズムを提案しています。MovePoseは、モバイルデバイスでの実時間人体姿勢推定の精度と速度を向上させるために設計された最適化された軽量畳み込みニューラルネットワークです。
主な特徴は以下の通りです:
大規模カーネル畳み込みを使用して受容野を拡大し、特徴マップの広範囲を scrutinize することで、優れたグローバル特徴を獲得しています。
通常のバイキュービック補間アップサンプリングの代わりにデコンボリューションネットワークを使用し、推定の複雑さを簡素化しつつ精度を向上させています。
SimCC手法を活用し、姿勢推定を回帰問題から分類問題に変換することで、計算コストを大幅に削減し、処理速度を高速化しています。
実験結果では、COCO検証データセットで68.0のmAP(Mean Average Precision)を達成し、Intel i9-10920xCPUで69+FPS、NVIDIA RTX3090 GPUで452+FPSの高速処理を実現しました。さらに、Snapdragon 8 + 4Gプロセッサ搭載のAndroidスマートフォンでも11FPS以上を達成しています。
MovePoseは、フィットネストラッキング、手話解釈、高度なモバイル人体姿勢推定など、様々なリアルタイムアプリケーションに適しており、この分野での有力なツールとなることが期待されます。
Stats
MovePoseはCOCO検証データセットで68.0のmAPを達成しました。
Intel i9-10920xCPUで69+FPSの処理速度を実現しました。
NVIDIA RTX3090 GPUで452+FPSの処理速度を実現しました。
Snapdragon 8 + 4Gプロセッサ搭載のAndroidスマートフォンで11FPS以上を達成しました。
Quotes
"MovePoseは、モバイルデバイスでの実時間人体姿勢推定の精度と速度を向上させるために設計された最適化された軽量畳み込みニューラルネットワークです。"
"MovePoseは、COCO検証データセットで68.0のmAPを達成し、Intel i9-10920xCPUで69+FPS、NVIDIA RTX3090 GPUで452+FPSの高速処理を実現しました。"
"MovePoseは、フィットネストラッキング、手話解釈、高度なモバイル人体姿勢推定など、様々なリアルタイムアプリケーションに適しており、この分野での有力なツールとなることが期待されます。"