Core Concepts
データ拡張メトリクスを使用して、Sim-to-Realトレーニングのパフォーマンスを予測するための遺伝学習手法を紹介します。
Abstract
この論文は、Sim-to-Realドメインギャップを埋めるためのデータ拡張の重要性に焦点を当てています。異なる拡張ポリシーに対する2つの解釈可能なメトリクスが提案され、遺伝的プログラミングアルゴリズムが自動的にデータセットに最適な拡張ポリシーを設計する方法が示されています。実験結果では、提案されたメトリクスとパフォーマンスの間に強い相関があることが示されています。さらに、他のデータ駆動型およびドメイン適応オブジェクト検出手法と比較して、提案手法が優れた結果を示しています。
1 Introduction
ディープラーニングアーキテクチャは複雑なコンピュータビジョン問題を解決できるが、大量のラベル付きトレーニングデータが必要。
合成データは注目されており、画像はシーン表現からレンダリングされ、注釈はその表現から派生。
2 Method
物体検出ニューラルネットワークfとバックボーンbおよび検出ヘッドhを考慮。
3 Experiments
異なる拡張技術と設定で多くの物体検出モデルを訓練し、パフォーマンス差を示す。
4 Genetic Learning Results
GeneticAugmentポリシーは他の方法よりも優れた結果を示し、シーケンシャル戦略も高いパフォーマンス。
Stats
Neural networks are sensitive to this domain shift. When trained on synthetic data, they tend to perform significantly worse on real data.
Domain Adaptation techniques are also used to overcome the sim-to-real domain gap.
Data augmentation is a technique that alters images from the training set to create new images, thus enlarging the training set and potentially increasing the performance of the neural network.
Since it introduces randomness and widens the training data distribution, data augmentation is also very useful for training on synthetic data.
Many different individual augmentation operations exist, such as cropping, rotating, blurring, and adding noise.
Quotes
"Data augmentations are useful in closing the sim-to-real domain gap when training on synthetic data."
"Some policies work better than others for overcoming the sim-to-real gap for specific datasets, and it is unclear why."
"We validate our metrics by training many models with different augmentation policies and showing a strong correlation with performance on real data."