Core Concepts
単一ステージと二ステージの3Dトラッキングアルゴリズムを比較し、単一ステージアルゴリズムが特に複雑な環境で優れた追跡精度を示すことを明らかにした。
Abstract
本研究では、温室ロボティクスにおける3Dトラッキングアルゴリズムとして、二ステージの3D-SORT と単一ステージのMOT-DETRを比較した。
実験では、ロボットアームが温室内で行う3種類の動作シーケンス(Sort、Random、AP)を対象とした。これらのシーケンスは、視点間の距離や遮蔽物の程度が異なり、ロボットが遭遇する複雑さの違いを表している。
結果として、検出精度ではYOLOv8を使う3D-SORTが優れていたが、全体的な追跡精度ではMOT-DETRが一貫して高い性能を示した。特に、視点間の距離が大きく、一時的に物体が視野から外れるような複雑なシーケンスでMOT-DETRの優位性が顕著だった。これは、MOT-DETRが色画像とポイントクラウドの全体情報を使って物体間の関係性をエンコードできるためと考えられる。
一方、能動知覚(AP)アルゴリズムを使って視点を選択すると、両アルゴリズムの追跡精度が向上した。APにより遮蔽が少ない視点が選択されたため、検出と追跡が容易になったと考えられる。
以上より、単一ステージアルゴリズムであるMOT-DETRは、特に複雑な環境下でより優れた追跡性能を発揮することが示された。一方、二ステージアルゴリズムの3D-SORTは検出精度に優れるものの、全体的な追跡精度では劣ることが明らかになった。
Stats
温室内の5つの植物から収集した5,400枚の画像と点群データを使用した。
ロボットアームの動作パターンにより、視点間の距離や遮蔽物の程度が異なる3種類のシーケンスを生成した。
Quotes
"単一ステージ方式のMOT-DETRは、特に複雑な環境下でより優れた追跡性能を発揮することが示された。"
"二ステージ方式の3D-SORTは検出精度に優れるものの、全体的な追跡精度では劣ることが明らかになった。"