本研究提出了一種新的方法,結合 YOLO NAS Small 架構和 Super Gradients 訓練框架,用於提供視障者室內導航的即時語音引導。
主要內容包括:
提出了一種利用 YOLO NAS Small 架構的小型物件偵測系統,該架構針對小型物件的偵測進行了優化設計。
將 Super Gradients 訓練框架整合到系統中,利用其先進的優化算法和超參數調整策略,進一步提高了小型物件的偵測準確性和效率。
採用非極大值抑制(NMS)技術,消除了模型預測中的冗餘邊界框,提高了最終的偵測精度。
將偵測結果轉換為語音反饋,為視障者提供即時的環境信息,增強他們的空間感知和交互能力。
實驗結果表明,該系統在小型物件偵測方面的性能優於其他主流的 YOLO 模型,mAP@0.50 達到了0.96,並且具有較快的推理速度,適合部署在資源受限的輔助設備上。這為未來開發更強大和用戶友好的視障者輔助技術奠定了基礎。
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Rashmi BN (J... alle arxiv.org 09-13-2024
https://arxiv.org/pdf/2409.07469.pdfDomande più approfondite