Das DiffPrompter-Framework wurde entwickelt, um die semantische Segmentierung unter widrigen Wetterbedingungen zu verbessern. Es verwendet große Grundmodelle und verfeinert sie mithilfe differenzierbarer visueller Prompts.
Die Autoren führen zwei Architekturvarianten ein: den Parallelen Differenzierbaren Adaptor (PDA) und den Sequenziellen Differenzierbaren Adaptor (SDA). Beide Adaptoren verwenden einen differenzierbaren Bildverarbeitungsblock namens ∇HFC, der sich besonders bei widrigen Wetterbedingungen bewährt.
Darüber hinaus untersuchen die Autoren die Vorteile des gemeinsamen Trainings von visuellen und latenten Prompts. Sie zeigen, dass dieser kombinierte Ansatz die Leistung in Verteilungen außerhalb des Trainings deutlich verbessert.
Die differenzierbaren visuellen Prompts nutzen parallele und serielle Architekturen, um Prompts zu generieren und die Objektsegmentierung unter widrigen Bedingungen zu verbessern. Umfangreiche Experimente und Evaluierungen belegen die Wirksamkeit des Ansatzes.
翻譯成其他語言
從原文內容
arxiv.org
深入探究