Core Concepts
人間中心のビジョンタスクにおけるデータ拡張技術の包括的な分析とその重要性を強調する。
Abstract
この記事は、人間中心のビジョンタスクにおけるデータ拡張技術に焦点を当て、主要な研究領域であるPerson ReID、Human Pose Estimationなどについて包括的な分析を提供しています。データ拡張方法は、データ生成とデータ摂動の2つの主要タイプに分類されます。グラフィックエンジンベースの生成や生成モデルベースの生成などが含まれます。さらに、画像レベルや人物レベルでの摂動も詳細に説明されています。
1 Introduction
人間中心の視覚タスクへの挑戦:コンピュータビジョンと機械学習コミュニティ内で注目される人間中心パースペクティブ。
データ拡張:高い収集および注釈コストを考慮した実用的な解決策。
2 Categorized by Data Augmentation Method
データ摂動:画像レベルと人物レベルで変更を加え、トレーニングセットを豊かにする方法。
データ生成:グラフィックエンジンや生成モデルを使用して新しいインスタンスを作成し、訓練セットを増やす方法。
3 Categorized by Human-Centric Vision Tasks
Person ReID: 画像レベル摂動やグラフィックエンジンベースの生成が効果的。
Human Pose Estimation: 2D/3Dポーズ変換やリアル背景合成が重要。
4 Person ReID Performance Comparison on Market1501 Dataset
DG-Netが最高性能を示し、FD-GANやPN-GANも優れた結果を示す。
5 2D Human Pose Estimation Performance Comparison on MS-COCO Dataset
PoseTransが他の手法よりも優れたパフォーマンスを示すことが確認された。
Stats
Random erasing [46]はmAP値71.3%でRank-1値87.0%を達成した。
CamStyle [43]はmAP値71.6%でRank-1値89.5%を達成した。
Quotes
"Data augmentation emerges as a practical solution, particularly in the context of high collection and annotation costs."
"Global perturbation methods modify the overall characteristics of an image, introducing variations such as noise addition or style transfer."