Core Concepts
ビジョントランスフォーマーネットワークを使用したコース・トゥ・ファイン検出手法により、ドローン間検出の性能を大幅に向上させることができる。
Abstract
本研究では、ドローン間検出のための新しいコース・トゥ・ファイン検出手法を提案している。ドローン間検出は、衝突回避、敵対的ドローンの対処、捜索救助活動での協調などの重要なアプリケーションに不可欠である。しかし、ドローン間検出には小さなオブジェクトサイズ、歪み、遮蔽、リアルタイム処理要件などの課題がある。
提案手法では、まず、Swin Transformerをバックボーンとして使用し、マルチスケールの特徴を抽出する。次に、Object Enhancement Netワークを導入して特徴を精製し、オブジェクトらしさマスクを生成する。このマスクを利用して、DAB DETRのデコーダクエリを初期化することで、効率的にドローンの位置を特定する。
提案手法は、FL-Drones、NPS-Drones、AOTの3つの難易度の高いデータセットで評価され、従来手法に比べて7%、3%、1%のF1スコア向上を達成した。さらに、エッジデバイスへの実装も可能で、リアルタイム性能を発揮することを示した。
Stats
ドローンのサイズは、フレームサイズの0.05%から0.08%しかない
連続フレームでもドローンの形状が急激に変化する
背景とのコントラストが低く、ドローンが目立たない
Quotes
"ドローン間検出は、衝突回避、敵対的ドローンの対処、捜索救助活動での協調などの重要なアプリケーションに不可欠である。"
"ドローン間検出には小さなオブジェクトサイズ、歪み、遮蔽、リアルタイム処理要件などの課題がある。"