Core Concepts
重み付きロス関数と転移学習を組み合わせることで、単眼深度推定の精度と頑健性を大幅に向上させることができる。特に、EfficientNetをエンコーダとして使用し、最適化されたロス関数を適用することで、従来手法を大きく上回る性能を達成した。
Abstract
本研究では、単眼深度推定の精度向上を目的として、重み付きロス関数と転移学習の活用を提案している。
まず、深度推定の精度に大きな影響を与える損失関数に着目し、平均絶対誤差(MAE)、エッジロス、構造的類似性指標(SSIM)の3つの損失関数を組み合わせた重み付きロス関数を提案した。損失関数の重み係数は、グリッドサーチとランダムサーチによる最適化を行い、MAE 0.6、エッジロス 0.2、SSIM 1.0が最適であることを示した。
次に、エンコーダとしてDenseNetやEfficientNetといった高性能な分類モデルをプリトレーニングして転移学習を行い、シンプルなデコーダと組み合わせることで、深度推定の精度を大幅に向上させた。特に、EfficientNetをエンコーダとして使用した場合に最も優れた結果が得られ、RMSE 0.386、REL 0.113、log10 0.049と、従来手法を大きく上回る性能を達成した。
定量的評価に加えて、定性的な分析も行った。その結果、提案手法は地面真値に非常に近い深度マップを生成できることが確認された。特に、地面真値に誤りがある場合でも、提案手法は適切な深度情報を推定できることが示された。
以上より、重み付きロス関数と転移学習を組み合わせた提案手法は、単眼深度推定の精度と頑健性を大幅に向上させることができることが明らかになった。今後は、安全性が重要な応用分野への適用を目指し、さらなる信頼性と解釈可能性の向上に取り組む予定である。
Stats
提案手法のRMSEは0.386と、従来手法に比べて大幅に低減された。
提案手法のRELは0.113と、従来手法に比べて優れた精度を示した。
提案手法のlog10エラーは0.049と、従来手法に比べて小さい値を達成した。