Core Concepts
不連続なビデオフレームを持つ行動認識タスクの性能低下を解決するため、アニメーション生成を用いたデータ拡張手法を提案する。
Abstract
本研究では、不連続なビデオフレームを持つ行動認識タスクの性能低下の問題に取り組む。
不連続なビデオフレームが行動認識モデルの性能を大幅に低下させ、データ拡張プロセスを複雑化させる問題を明らかにする。
4A (Action Animation-based Augmentation Approach)と呼ばれる新しいデータ拡張パイプラインを提案し、この問題に対処する。
4Aは、不連続なビデオから滑らかで自然な動作表現を生成することができ、最新のデータ拡張手法よりも優れている。
元のデータの10%しか使わずに、元のデータ全体と同等の性能を達成し、野生のビデオでも優れた性能を示す。
Stats
連続したビデオフレームを使った場合の行動認識モデルの平均精度は約40%だが、フレームが欠落した場合は20%以下に低下する。
提案手法4Aを使うと、元のデータの10%しか使わずに、元のデータ全体と同等の性能を達成できる。
Quotes
"不連続なフレームによりビデオの時間情報が欠落すると、行動の意味理解が低下し、行動認識タスクが脆弱になる。"
"4Aは、不連続なビデオから滑らかで自然な動作表現を生成することができ、最新のデータ拡張手法よりも優れている。"