核心概念
本文提出了一種名為 AIScene 的新型半監督式光達語義分割方法,旨在解決現有方法在處理帶有和不帶偽標籤點雲時的場景一致性問題,並透過多場景混合增強資料集的語義多樣性,從而提升模型在有限標註資料下的分割效能。
摘要
研究目標
本研究旨在解決現有半監督式光達語義分割方法中存在的兩個主要問題:場景內部不一致性以及資料增強過程中語義多樣性受限,並提出相應的解決方案以提升模型在有限標註資料下的分割效能。
方法
本研究提出了一種名為 AIScene 的新型半監督式光達語義分割方法,其核心包含兩個主要部分:
- 點雲擦除策略 (Point Erasure Strategy):
- 針對現有方法在訓練過程中將所有點雲用於前向傳播,但僅使用帶有偽標籤的點雲進行反向傳播,導致場景內部不一致性的問題,AIScene 提出點雲擦除策略,在訓練過程中直接移除不帶偽標籤的點雲,確保前向和反向傳播的一致性,避免語義模糊點雲對模型學習造成干擾。
- 基於圖塊的資料增強 (Patch-based Data Augmentation):
- 為了解決現有資料增強方法僅在兩個場景間進行混合,導致語義多樣性受限的問題,AIScene 提出基於圖塊的資料增強方法,透過構建場景級別和實例級別的圖塊池,將多個場景的圖塊進行混合,並根據場景間的關聯性選擇合適的圖塊進行填充,從而提升資料集的語義多樣性。
主要發現
- 實驗結果顯示,AIScene 在 SemanticKITTI 和 nuScenes 兩個公開資料集上均取得了優於現有方法的效能表現,尤其是在標註資料比例極低的情況下 (例如 1% 標註比例),AIScene 的效能提升更加顯著。
- 消融實驗結果表明,點雲擦除策略和基於圖塊的資料增強方法均能有效提升模型效能,且兩者結合使用時效果最佳。
主要結論
- AIScene 方法能夠有效解決現有半監督式光達語義分割方法中存在的場景一致性和語義多樣性問題,並在有限標註資料下取得顯著的效能提升。
- 點雲擦除策略和基於圖塊的資料增強方法可以獨立應用於其他基於偽標籤機制的半監督式光達語義分割方法中,具有良好的泛化能力。
研究意義
本研究提出的 AIScene 方法為半監督式光達語義分割提供了一種新的思路,有助於降低對大量標註資料的依賴,並為自動駕駛等領域的 3D 環境感知技術發展提供技術支持。
局限與未來研究方向
- 本研究主要針對駕駛場景下的光達語義分割任務,未來可以進一步探索 AIScene 方法在其他應用場景下的泛化能力。
- 基於圖塊的資料增強方法中,圖塊大小和填充策略等參數對模型效能有一定的影響,未來可以進一步研究如何自適應地調整這些參數以獲得更優的效能表現。
統計資料
AIScene 在 SemanticKITTI 資料集上,僅使用 1% 的標註資料,相較於現有最佳方法 DDSemi,mIoU 提升了 1.9%。
AIScene 在 nuScenes 資料集上,僅使用 1% 的標註資料,相較於現有最佳方法 DDSemi,mIoU 提升了 5.3%。
在 SemanticKITTI 資料集上,使用點雲擦除策略後,模型在不同標註資料比例下,mIoU 平均提升了 3.9%。
在 SemanticKITTI 資料集上,使用基於圖塊的資料增強方法後,模型在不同標註資料比例下,mIoU 平均提升了 5.6%。
將圖塊分割數量設定為 18 時,模型在 SemanticKITTI 資料集上的分割效能最佳。
引述
"To address inconsistency and implement the multi-scene mixing idea, we explore Scene AffInity for semi-supervised LiDAR semantic segmentation, named AIScene."
"AIScene has been extensively evaluated through experiments and demonstrated superiority on two popular benchmarks for semi-supervised LiDAR semantic segmentation."
"It exceeds state-of-the-art methods by 1.3% on the SemanticKITTI [2] and 2.4% on the nuScenes [10] in terms of average performance across four settings (1%, 10%, 20%, and 50% labeled data)."