Offenes Vokabular-Lebensmittelbildsegmentierung durch bildbasierte Textrepräsentation
Das OVFoodSeg-Modell verbessert die Leistung bei der Segmentierung von Lebensmittelbildern mit offenen Vokabularklassen, indem es visuelle Informationen in die Textrepräsentation integriert.