Effiziente Datenfreie Multi-Label Bilderkennung durch Prompt-Anpassung mit LLM
Ein neuartiges Framework für die datenfreie Multi-Label Bilderkennung nutzt Wissen von Large Language Models (LLM) zur Anpassung von Vision-Language Models (VLM) wie CLIP durch Prompt-Tuning.