本文提出了一個名為DetailCLIP的新框架,旨在解決CLIP及其變體在細粒度任務(如分割)中的局限性。
實驗結果表明,DetailCLIP在分割和物體檢測等需要高精度的任務上顯著優於其他CLIP系列和自監督學習模型,同時在零shot分類等粗粒度任務上也表現出色。
Ke Bahasa Lain
dari konten sumber
arxiv.org
Wawasan Utama Disaring Dari
by Amin Karimi ... pada arxiv.org 09-12-2024
https://arxiv.org/pdf/2409.06809.pdfPertanyaan yang Lebih Dalam