核心概念
ASBAR (Animal Skeleton-Based Action Recognition) フレームワークを使用して、野生の大型類人猿の行動を高精度で分類することができる。
摘要
ASBAR フレームワークは、動物の姿勢推定と行動認識の2つの機能を統合したものです。まず、OpenMonkeyChallenge データセットを使用して、26種の霊長類の頑健な姿勢推定モデルを構築しました。次に、PanAf データセットから大型類人猿の骨格運動を抽出し、MMaction2 の PoseConv3D モデルを使って9つの行動カテゴリを分類しました。その結果、従来のビデオベースの手法と同等の精度(Top1 精度74.98%)を達成しつつ、入力サイズを約20倍小さくすることができました。さらに、姿勢ベースのアプローチは視覚的な環境変化に対してより頑健であるため、野外調査での利用に適しています。本研究では、他の種や行動への適用を容易にするためのGUIツールも提供しています。
統計資料
大型類人猿の行動を9つのカテゴリに分類する際の Top1 精度は74.98%である。
従来のビデオベースの手法と比べ、入力サイズを約20倍小さくすることができる。
引述
"Recent advances in machine learning computer vision techniques can offer innovative ways to build such systems, as some of their models can be trained to recognize or detect behaviors recorded on videos."
"Skeleton-based methods are less sensitive to these changes [in visual settings] and, given a robust pose estimator, are therefore likely to maintain a high action recognition accuracy."