Core Concepts
Wake Visionは、TinyMLの人物検出研究を促進するための大規模で多様なデータセットとベンチマークスイートを提供する。
Abstract
Wake Visionは、TinyMLの人物検出研究を促進するための大規模で多様なデータセットとベンチマークスイートを提供する。
Wake Visionは、従来の標準であるVisual Wake Words (VWW)データセットに比べて、100倍以上の規模を持つ。
Wake Visionには、距離、照明、描写、性別、年齢などの観点から人物検出モデルの性能を評価するための5つの詳細なベンチマークセットが含まれている。
Wake Visionを使ってモデルを訓練すると、VWWを使った場合に比べて2.41%の精度向上が得られる。
Wake Visionのベンチマークを使った分析により、入力解像度がモデルの遠距離被写体検出性能に大きな影響を与えることや、量子化がモデルの頑健性にほとんど影響しないことが明らかになった。
Wake Visionのデータセットとベンチマークスイートは、商用利用を含む研究目的で公開されている。
Stats
遠距離の被写体を検出する際は、モデルサイズよりも入力解像度の方が重要である。
量子化によるモデルの頑健性への影響は最小限である。