מושגי ליבה
本研究提出一個基於時空關聯性的新型半監督式學習方法,解決低標註預算下光達語義分割的效能問題,並在 SemanticKITTI 和 nuScenes 資料集上達到新的最佳效能。
תקציר
文獻摘要
本研究旨在探討低標註預算下,半監督式光達語義分割 (SSLS) 所面臨的挑戰。作者指出,低標註預算 SSLS 的兩大問題是:未標註資料的偽標籤品質不佳,以及標註資料和偽標籤之間顯著不平衡導致的效能下降。為了解決這些問題,作者利用時空先驗資訊,特別是利用相鄰光達掃描之間的重疊性。
本研究提出一個基於鄰近度的標籤估計方法 (PLE),透過利用與相鄰標註資料的語義一致性,為未標註資料生成高精度的偽標籤。此外,作者透過從最近的未標註掃描逐步擴展偽標籤來增強此方法,這有助於顯著減少與動態類別相關的錯誤。此外,作者採用雙分支結構來減輕資料不平衡造成的效能下降。
實驗結果顯示,該方法在低標註預算設定(例如,≤5%)下表現出色,並在正常標註預算設定(例如,5-50%)下也有顯著改進。最後,該方法在 SemanticKITTI 和 nuScenes 的半監督式光達語義分割中取得了新的最佳結果。僅使用 5% 的標註資料,它就提供了與全監督式方法相當的結果。此外,在 nuScenes 上,它僅使用 20% 的標註資料 (76.0%) 就超過了先前使用 100% 標註資料 (75.2%) 的最佳效能。
研究方法
- 基於鄰近度的標籤估計 (PLE):利用光達資料固有的時空特性,參考鄰近的已標註掃描,為未標註資料生成高精度的偽標籤。
- 座標轉換:將參考的已標註掃描的座標轉換到目標未標註掃描的座標系中。
- 鄰近點識別:在座標系中識別與目標未標註點重合(或最接近)的鄰近已標註點。
- 標籤分配:將所選已標註點的標籤作為偽標籤轉移到未標註點。
- 漸進式 PLE:為了解決動態物件的效能限制,從最接近已標註掃描的未標註掃描開始依序生成標籤,並逐步移至更遠的掃描,從而顯著減少已標註和未標註資料之間的有效時間間隔。
- 雙分支結構:採用雙分支架構來減輕資料不平衡造成的效能下降。
- 乾淨分支 (C-branch):使用準確的標籤(真實標籤和 PLE 標籤)進行訓練。
- 噪聲分支 (N-branch):使用教師網路生成的噪聲偽標籤進行訓練。
實驗結果
- 在 SemanticKITTI 和 nuScenes 資料集上,該方法在所有標註比例下均優於當前的最佳方法,尤其是在低標註比例設定下。
- 在 nuScenes 上,僅使用 20% 的標註資料就超過了先前使用 100% 標註資料的最佳效能。
- 消融實驗證明了 PLE 和雙分支結構的有效性。
總結
本研究提出了一種新穎的半監督式光達語義分割方法,透過利用時空先驗資訊和雙分支結構,有效解決了低標註預算下的效能問題,並在基準資料集上取得了新的最佳結果。
סטטיסטיקה
在 nuScenes 資料集上,該方法僅使用 20% 的標註資料 (76.0%) 就超過了先前使用 100% 標註資料 (75.2%) 的最佳效能。
在 5% 標註比例下,PLE 生成了超過一半的光達掃描資料。
PLE 標籤的 mIoU 超過 79%,優於 mIoU 約為 70% 的最佳全監督式模型。
與教師網路生成的偽標籤相比,PLE 標籤的準確度始終高出 10% 以上。
ציטוטים
"By leveraging the inherent spatio-temporal prior in LiDAR data, we propose a Proximity-based Label Estimation (PLE) to produce accurate pseudo-labels for unlabeled scans."
"Our method establishes new SoTA benchmarks in semi-supervised LiDAR segmentation, surpassing other leading techniques across all labeling ratios."
"This highlights the complementary effects of PLE and the dual-branch, thereby establishing the effectiveness of each module in our method."