本文提出了一個將大型語言模型(LLM)與邊緣設備相結合的框架,用於自動駕駛場景的描述和推理。該框架部署在路側單元(RSU)上,利用5G NR/NSA技術進行通信。每個RSU獨立處理其覆蓋區域內的交通數據,避免了冗餘操作和數據擁塞,從而實現了更快的響應速度。
為了進一步提高LLM在視覺特徵處理方面的準確性,作者提出了一種使用環境、代理和運動信息的三流提示策略。這些信息流將提取的特徵轉換為結構化的自然語言描述和推理提示,引導LLM生成特定上下文的響應。
實驗結果表明,啟用提示策略後,所有四個LLM模型的描述準確率都超過70%,其中最高的達到81.7%的推理準確率。此外,部署在邊緣設備上的LLM能夠在0.5秒或更短的時間內處理複雜的駕駛場景,顯著提高了系統的實時性能。
作者還設計了一個可視化窗口,允許邊緣用戶通過手機或平板電腦上傳交通信息,以解決固定收集系統的盲點問題。整個框架實現了LLM與邊緣設備的有效集成,在提高自動駕駛系統的安全性和效率方面具有重要意義。
Vers une autre langue
à partir du contenu source
arxiv.org
Questions plus approfondies