Core Concepts
動的プロキシドメインを導入することで、群衆位置推定の一般化性能を向上させることができる。
Abstract
本論文では、群衆位置推定の一般化性能を向上させるために、動的プロキシドメインを提案している。群衆位置推定は、画像内の各人物の正確な位置を予測することを目的とする。現在の高度な手法は、混雑した予測に対処するためにピクセルごとのバイナリ分類を提案している。しかし、群衆シーンは極端に変化する内容、数、スケールに苦しむため、信頼度しきい値学習者は脆弱で一般化が不足している。さらに、ほとんどの場合、ターゲットドメインは訓練時に未知である。したがって、潜在的なターゲットドメインに対するしきい値ロケーターの一般化を向上させる方法を活用することが重要である。
本論文では、動的プロキシドメイン(DPD)手法を提案し、ドメインシフトの下でロケーターの一般化を向上させている。具体的には、バイナリ分類器の潜在的なターゲットドメインの一般化誤差リスクの上限に関する理論分析に基づいて、一般化を促進するためのプロキシドメインを導入することを提案している。次に、理論に基づいて、DPD アルゴリズムを設計し、プロキシドメインジェネレーターとトレーニングパラダイムで構成されている。さらに、5つのドメインシフトシナリオで提案手法を検証し、群衆位置推定の一般化に効果があることを実証している。
Stats
群衆シーンは極端に変化する内容、数、スケールに苦しむ
信頼度しきい値学習者は脆弱で一般化が不足している
ほとんどの場合、ターゲットドメインは訓練時に未知である
Quotes
群衆位置推定は、画像内の各人物の正確な位置を予測することを目的とする。
現在の高度な手法は、混雑した予測に対処するためにピクセルごとのバイナリ分類を提案している。
動的プロキシドメイン(DPD)手法を提案し、ドメインシフトの下でロケーターの一般化を向上させている。