本文介紹了一種新的方法,利用穩定擴散模型生成高質量的合成水下圖像數據,並將其與真實數據結合,訓練出一個基於 YOLOv10 的視覺模型,在 Aqua2 水下機器人平台上實現了牡蠣的實時檢測。這不僅提高了牡蠣棲息地監測的效率,也為各種水下任務的自主監視鋪平了道路,改善了水產養殖和保護工作。
具體來說,文章首先介紹了 Aqua2 水下機器人平台的硬件和軟件架構,包括其生物模擬設計、強大的邊緣計算能力以及用於水下成像的多個攝像頭。然後詳細描述了合成數據生成的流程,包括使用 Blender 渲染出具有精確幾何信息的牡蠣模型,並利用 Stable Diffusion 和 ControlNet 將其轉化為與真實水下環境高度一致的圖像。最後,作者對訓練有真實和合成數據的各種 YOLOv10 子模型進行了詳細的實驗評估,證明了合成數據的有效性,並在 Aqua2 平台上實現了牡蠣的實時檢測。
翻譯成其他語言
從原文內容
arxiv.org
深入探究