核心概念
ドローンによる地表設置型地雷の検出において、様々な物体検出モデルを比較した結果、YOLOFが精度と速度の面で優れていることが示された。
要約
論文情報
Agrawal-Chung, N., & Moin, Z. (2024). Comparing Surface Landmine Object Detection Models on a New Drone Flyby Dataset.
研究目的
本研究は、ドローンで撮影した映像から地表設置型地雷を検出する最適な物体検出モデルを特定することを目的とする。
方法
- ロシアの地雷POM-2とPOM-3の縮尺模型を用いて、ドローン映像のデータセットを作成。
- YOLOF、DETR、Sparse-RCNN、VFNetの4つのモデルを、Azureクラウドコンピューティング環境でトレーニング。
- 異なる高度(2.5m、5m、10m)で撮影した画像を用いて、各モデルの検出精度(mAPスコア)、推論時間、その他のパラメータを比較評価。
結果
- 4つのモデル全てが、高度2.5mと5m、植生の少ない環境下では良好な検出精度を示した。
- 高度10mでは、YOLOFが他のモデルよりも高い精度を示した。
- ドローンの速度は、画像安定化機能により、検出精度に影響を与えなかった。
- YOLOFは、トレーニングの収束が容易で、モデルサイズが小さく、トレーニング時間も短かった。
- 熱画像を用いた推論は、使用したカメラの解像度が限られていたため、高度2.5mの画像に限定された。
結論
- 地表設置型地雷の検出には、YOLOFが精度と速度の面で優れている。
- 植生の多い環境下での地雷検出には、更なる研究が必要である。
論文の意義
本研究は、ドローンを用いた地雷検出技術の向上に貢献するものであり、将来的には、地雷除去作業の効率化、安全性の向上、コスト削減などが期待される。
限界と今後の課題
- 熱画像を用いた地雷検出は、解像度の高いカメラを用いた更なる研究が必要である。
- 実際の地雷を使用したデータセットの作成が課題である。
統計
地雷検出ソフトウェアSpotlightAIは、Safe Proグループとオクラホマ大学のJohn Frucci氏によって開発された。
過去50年間で、地雷による死傷者は100万人を超えている。
地雷の設置速度は除去速度の25倍である。
ウクライナでは、国土の25%にあたる175,000平方キロメートルが地雷埋設地域となっている。
国連は、ウクライナの地雷除去には100年以上、370億ドル以上の費用がかかると推定している。
地雷専門家の訓練には、7ヶ月以上の期間と15万ドル以上の費用がかかる。
衛星画像の解像度は、通常5m/ピクセル以下である。
POM-2やPOM-3などの地雷の大きさは、衛星画像では検出が困難である。
ドローンは、地雷検出のための新しい手段として期待されている。
ドローンによる地雷検出の課題としては、データセットの不足、訓練済みモデルの不足、実用的なソリューションガイドラインの不足などが挙げられる。
本研究では、DJI-Mini3ドローンを用いて、720pと1080pの解像度で画像と動画を撮影した。
ドローンは、地上2.5m、5m、10mの高度で飛行させた。
熱画像は、FLIR One Edge Pro長波赤外線(LWIR)カメラを用いて撮影した。
熱カメラの解像度は、160 x 120ピクセルであった。
ドローンの速度は、2m/sから最大速度の15m/sまで変化させた。
トレーニングには、320枚の画像を使用し、テストデータセットには70枚の画像を使用した。
元の画像は1080pの解像度であったが、トレーニングの収束のために800 x 450の解像度にリサイズした。
YOLOFの最終的な損失は0.245であり、他のモデルよりも優れていた。
YOLOFのトレーニング時間は56分30秒であった。
DETRのトレーニング時間は1時間11分2秒であった。
Sparse-RCNNのトレーニング時間は1時間2分28秒であった。
VFNETのトレーニング時間は1時間0分28秒であった。
推論には、元のサイズの画像(解像度を下げていないもの)を使用した。
高度10mの画像では、YOLOFのmAPスコアは0.89であった。
DETR、Sparse-RCNN、VFNETのmAPスコアは、いずれも0.82程度であった。