toplogo
Sign In

超低消費電力組み込みシステムのための動画オブジェクト検出のためのマルチ解像度リスコアByteTrack


Core Concepts
マルチ解像度リスコアByteTrackは、オフザシェルフの深層学習ベースのオブジェクト検出器と時間相関を活用するByteTrackトラッカー、そして誤分類を修正する新しい確率的リスコアアルゴリズムを組み合わせることで、超低消費電力組み込みシステムでの高精度な動画オブジェクト検出を実現する。
Abstract
本論文は、超低消費電力の組み込みプロセッサ向けの新しい動画オブジェクト検出フレームワーク「マルチ解像度リスコアByteTrack (MR2-ByteTrack)」を提案する。 この手法は、オフザシェルフの深層学習ベースのオブジェクト検出器と、ByteTrackトラッカー、そして新しい確率的リスコアアルゴリズムを組み合わせることで、検出精度の向上と計算コストの削減を実現する。 具体的には、高解像度画像(320x320ピクセル)と複数の低解像度画像(192x192ピクセル)を交互に入力することで、平均的な計算負荷を最大2.25倍削減する。低解像度入力による精度低下を補うため、ByteTrackトラッカーを用いて時間的な検出結果の相関を取り、リスコアアルゴリズムで誤分類を修正する。 提案手法をGAP9マイクロコントローラ上に実装し、既存の単一解像度の手法と比較して、平均精度(mAP)を2.16%向上させつつ、レイテンシを43%削減することを示した。また、YOLOVなどの最新の動画オブジェクト検出手法と比較しても、同等の精度を維持しつつ、メモリやコンピューティングリソースの使用量を大幅に削減できることを確認した。
Stats
単一解像度の検出器と比べて、MR2-ByteTrackは平均MAC演算を最大43%削減できる MR2-ByteTrackは単一解像度の検出器と比べて、mAPを最大2.16%向上させることができる MR2-ByteTrackは単一解像度の検出器と比べて、レイテンシを最大43%削減できる
Quotes
"マルチ解像度リスコアByteTraック (MR2-ByteTrack)は、オフザシェルフの深層学習ベースのオブジェクト検出器と、ByteTraックトラッカー、そして新しい確率的リスコアアルゴリズムを組み合わせることで、検出精度の向上と計算コストの削減を実現する。" "提案手法をGAP9マイクロコントローラ上に実装し、既存の単一解像度の手法と比較して、平均精度(mAP)を2.16%向上させつつ、レイテンシを43%削減することを示した。"

Deeper Inquiries

超低消費電力組み込みシステムでの動画オブジェクト検出の精度と効率性をさらに向上させるためには、どのような技術的アプローチが考えられるだろうか。

超低消費電力組み込みシステムにおいて動画オブジェクト検出の精度と効率性を向上させるためには、以下の技術的アプローチが考えられます。 モデルの最適化: より軽量で効率的なモデルの採用や、モデルの量子化などを通じて、モデルのパラメータ数や計算量を削減することが重要です。 低解像度画像の活用: 低解像度画像を活用して、高解像度画像との組み合わせによるマルチリゾリューションアプローチを採用することで、計算負荷を削減しつつ精度を維持することが可能です。 トラッキング技術の改善: より効率的なトラッキングアルゴリズムの導入や、オブジェクトの過去の動きを考慮した予測手法の組み込みによって、オブジェクトの追跡精度を向上させることが重要です。 これらのアプローチを組み合わせることで、超低消費電力組み込みシステムにおける動画オブジェクト検出の性能をさらに向上させることが可能です。
0
visual_icon
generate_icon
translate_icon
scholar_search_icon
star