Core Concepts
現実のアセンブリラインで効率的かつ高品質な大規模データセット拡張を実現するための戦略と、手の動作認識問題を解決する方法が提案されています。
Abstract
現代の産業用アセンブリラインでは、AIアルゴリズムが従業員を置き換えるか監督するために開発されています。
既存研究は、行動認識がこれらのアルゴリズムの中核的なタスクであることを探求しています。
産業用データセット不足やリアルタイム性能問題を解決するために、基盤モデルとスケルトンポイントを活用した新しい戦略が提案されています。
手の動作認識精度は98.8%に達し、Midea社の実際のアセンブリラインで展開されました。
自動工業データ拡張戦略
blip2、glip、vitモデルを使用して工業データセットを拡張します。
実際のアセンブリラインから得られた映像データから11,865枚の画像へ自動的に拡張されました。
スケルトンベース行動認識
LSTM時系列モデルを使用して骨格点行動分類を訓練します。
SBTメソッドは98.8%という高い精度で働く労働者の微細な運動も認識可能です。
スライディングウィンドウメソッド
リアルタイムパフォーマンス要件を考慮して、LSTM入力データ次元が一貫性を持つようにスライディングウィンドウメカニズムが組み込まれます。
Stats
工業用特殊検出小型モデルは42.81FPSで0.893の精度を達成しました。
SBTメソッドは98.8%という高い精度で働く労働者の微細な運動も認識可能です。