核心概念
提案手法ModTrは、事前学習された物体検出器のパラメータを変更せずに、新しい入力変調に適応することができる。これにより、単一の物体検出器を複数の変調に対して使用できるようになる。
要約
本研究では、物体検出器を新しい入力変調に適応させる方法であるModTrを提案している。従来の手法では、物体検出器をファインチューニングすることで新しい変調に適応させていたが、これにより元の知識が失われてしまう問題があった。
ModTrでは、物体検出器のパラメータを変更せずに、入力変調を変換するネットワークを学習する。これにより、元の知識を保ちつつ、新しい変調に適応することができる。
実験では、赤外線(IR)変調への適応を検討した。IRは可視光とは大きく異なる変調であるため、従来手法ではパフォーマンスが大きく低下していた。一方、ModTrは可視光の物体検出器をIRに適応させることができ、従来手法を大きく上回るパフォーマンスを示した。
さらに、ModTrのバックボーンネットワークを小さくすることで、パラメータ数を大幅に削減しつつ、同等のパフォーマンスを維持できることを示した。これにより、変調変換ネットワークを追加しても、全体のシステムコストを抑えられる。
以上より、ModTrは事前学習された物体検出器の知識を保ちつつ、新しい変調に適応できる強力な手法であることが示された。
統計
物体検出の平均精度(AP)は、LLVIP データセットでFCOSが57.63、RetinaNetが54.83、FasterRCNNが57.97であった。
FLIR データセットでは、FCOSが35.49、RetinaNetが34.27、FasterRCNNが37.21であった。
引用
"提案手法ModTrは、事前学習された物体検出器のパラメータを変更せずに、新しい入力変調に適応することができる。"
"ModTrは事前学習された物体検出器の知識を保ちつつ、新しい変調に適応できる強力な手法である。"