核心概念
Veri-Car 是一個基於圖像的車輛資訊檢索系統,採用預先訓練的模型、度量學習和分層多相似性損失來識別車輛的製造商、類型、型號、年份、顏色和車牌,並能有效處理開放世界問題,例如識別未見過的車型。
論文概述
本論文介紹了 Veri-Car,一個基於圖像的車輛資訊檢索系統,旨在從圖像中準確識別車輛的製造商、類型、型號、年份、顏色和車牌。Veri-Car 採用監督學習技術,並解決了處理開放世界問題的挑戰,即新車型和變化的不斷出現。
研究方法
Veri-Car 將檢索任務分為兩個主要組成部分:
製造商、型號、類型和年份預測: 使用 Stanford Cars 196 數據集,利用預先訓練的模型(如 CLIP 和 OpenCLIP),並通過度量損失進行微調,將相似的觀察結果在嵌入空間中映射得更近。
顏色預測: 使用 Kaggle 車輛顏色識別 (VCoR) 數據集,採用類似的架構和多相似性損失。
此外,Veri-Car 還具備强大的車牌檢索功能,它整合了 YOLOv5 車牌檢測模型和經過微調的 TrOCR 車牌識別模型,以高精度從圖像中提取車牌號碼。
核心貢獻
本論文的主要貢獻包括:
首次整合基於圖像的車輛資訊檢索系統,能夠在開放世界環境中對製造商、類型、型號、年份、顏色和車牌進行分類。
HiMS-Min,一種新的分層多相似性損失版本,可改善未見類別的表示。
一種用於顏色分類的檢索方法,與標準交叉熵訓練模型相比,該方法提高了性能。
一個在純合成數據上訓練車牌識別的框架,相對於特定國家的模型,該框架在多國領域取得了很高的性能。
一個用於生成合成數據以訓練車牌識別模型的系統,即使只有少量標記的特定國家數據可用,該系統在特定國家和多國領域都能提供强大的結果。
系統架構
Veri-Car 由幾個獨立的模組組成:
車輛檢測模組: 檢測車輛的邊界框並裁剪圖像。
OOD 檢測模組: 識別圖像是否為訓練數據中未見過的車型。
車牌檢索模組: 提取車牌號碼。
製造商、型號、類型、年份檢索模組: 識別車輛的製造商、型號、類型和年份。
顏色檢索模組: 識別車輛的顏色。
實驗結果
實驗結果表明,Veri-Car 在分類已見和未見數據方面均具有强大的性能,在分類精度和召回率方面均取得了很高的成績。此外,Veri-Car 的車牌檢索方法也表現出色,能夠以令人印象深刻的準確性提取車牌號碼。
結論
Veri-Car 是一個先進的車輛資訊檢索系統,在處理開放世界問題方面表現出色。該系統在各個領域都有潛在的應用,例如自動收費、保險公司、汽車經銷商、金融機構和增强的安全檢查。
統計資料
Stanford Cars 196 數據集包含 16185 張圖像和 196 個類別。
Kaggle 車輛顏色識別 (VCoR) 數據集包含 15 個顏色類別和 10.5K 張圖像。
HiMS-Min 在數據庫中有 8 個樣本的情況下,得分為 82.99%。
顏色檢索模型的 Precision1 達到 90.55%。
OOD 檢測中,HiMS-Min 的 FPR95 為 28.72%,AUROC 為 93.10%。
車牌識別方面,TrOCR with CCPD + Synthetic 模型在 CCPD 數據集上的正確率達到 77%。