Core Concepts
RGB画像と深度データの早期融合を用いた新しいマルチモーダル物体検出モデルは、従来のRGBのみ、深度のみのモデルと比較して、製造部品の検出精度を大幅に向上させる。
Abstract
製造部品向け深度・画像データを用いたマルチモーダル物体検出に関する研究論文の概要
Nazanin Mahjourian, Vinh Nguyen. (2024). MULTIMODAL OBJECT DETECTION USING DEPTH AND IMAGE DATA FOR MANUFACTURING PARTS. arXiv preprint arXiv:2411.09062.
本研究は、製造現場における部品の正確なピッキング・ハンドリングを目的とした、RGB画像と深度データを組み合わせた新しいマルチモーダル物体検出モデルであるRGBD-Manを提案し、その有効性を検証することを目的とする。