核心概念
未熟な緑色の果実の検出と姿勢推定におけるYOLO11の有効性、およびVision Transformer(特にDepth Anything V2)によるRGB画像からRGB-Dデータへの変換を通して、商業果樹園でのロボット間引きアプリケーションの精度と計算要件がどのように向上するかを検証する。
要約
研究論文の概要: YOLO11とVision Transformerによる未熟な緑色果実の3D姿勢推定
Sapkota, R., & Karkee, M. (2024). YOLO11 and Vision Transformers based 3D Pose Estimation of Immature Green Fruits in Commercial Apple Orchards for Robotic Thinning. arXiv preprint arXiv:2410.19846.
本研究は、商業リンゴ園におけるロボット間引きのための自動化システム開発に向け、YOLO11オブジェクト姿勢検出モデルとVision Transformerを用いた未熟な緑色リンゴ(果実)の3D姿勢推定の有効性を検証することを目的とする。