Core Concepts
事前学習済みのCNNネットワークを、再学習することなく、魚眼カメラ画像に適応させる手法を提案する。
Abstract
本研究では、事前学習済みのCNNネットワークを、魚眼カメラ画像に適応させる手法を提案している。従来の手法では、画像の歪みを補正する必要があり、その際に画像の一部が失われてしまうという問題があった。
提案手法では、畳み込み層をRectConv層に置き換えることで、画像の歪みに適応できるようにしている。RectConv層では、カメラのキャリブレーション情報を用いて、畳み込みカーネルの形状を局所的に変形させることで、歪んだ画像に適応できるようになる。
実験では、セグメンテーションとオブジェクト検出のタスクで、提案手法が従来手法を上回る性能を示した。特に、セグメンテーションでは大幅な性能向上が見られた。また、推論時間についても、パッチベースの手法と比べて大幅に短縮できることを示した。
提案手法は、事前学習済みのCNNネットワークを、再学習することなく、新しいカメラ特性に適応させることができる。これにより、既存のリソースを有効活用しつつ、新しいカメラ技術にも柔軟に対応できるようになる。
Stats
魚眼カメラ画像を直接畳み込みネットワークに入力すると、性能が大幅に低下する。
画像を矩形に補正してから入力すると、中心部分が欠落してしまう。
提案手法のRectConvを用いると、画像全体を活用しつつ、高い性能を達成できる。
Quotes
"事前学習済みのCNNネットワークを、再学習することなく、新しいカメラ特性に適応させることができる。"
"提案手法は、既存のリソースを有効活用しつつ、新しいカメラ技術にも柔軟に対応できるようになる。"