Core Concepts
FoodLMM ist ein vielseitiger Küchenassistent, der auf großen multimodalen Modellen basiert und verschiedene Fähigkeiten wie Lebensmittelerkennung, Zutatenidentifikation, Rezeptgenerierung, Nährwertschätzung, Lebensmittelsegmentierung und Mehrrunden-Konversation besitzt.
Abstract
Der Artikel stellt FoodLMM, einen vielseitigen Küchenassistenten auf Basis großer multimodaler Modelle (LMMs), vor. FoodLMM kann eine Vielzahl von Aufgaben im Lebensmittelbereich bewältigen, darunter:
Lebensmittelklassifizierung: FoodLMM erreicht eine Genauigkeit von 93,93% auf dem Food-101-Datensatz, was 3,07% über dem bisherigen Spitzenreiter liegt.
Zutatenidentifikation: FoodLMM übertrifft den bisherigen Spitzenreiter CACLNet um 3,2% in Bezug auf den F1-Wert auf dem VIREO Food-172-Datensatz.
Rezeptgenerierung: Ohne zusätzliche Informationen übertrifft FoodLMM den bisherigen Spitzenreiter FIRE deutlich auf dem Recipe1M-Datensatz.
Nährwertschätzung: FoodLMM kann die Gesamtnährwerte eines Gerichts präzise schätzen und reduziert den durchschnittlichen Vorhersagefehler um 4,5% im Vergleich zum bisherigen Spitzenreiter.
Lebensmittelsegmentierung: FoodLMM übertrifft den bisherigen Spitzenreiter LISA deutlich bei der Segmentierung von Lebensmitteln, sowohl bei der Segmentierung einzelner als auch mehrerer Zutaten.
Darüber hinaus wurde FoodLMM mit zwei neuen Benchmarks trainiert, um seine Fähigkeiten in Mehrrunden-Konversationen und komplexer Lebensmittelsegmentierung zu verbessern. Die Ergebnisse zeigen, dass FoodLMM in diesen Bereichen hervorragende Leistungen erbringt.
Stats
Das Gericht hat ein Gesamtgewicht von 672,0 g.
Das Gericht enthält 760,0 kcal Kalorien.
Das Gericht enthält 46,5 g Fett.
Das Gericht enthält 24,0 g Kohlenhydrate.
Das Gericht enthält 68,0 g Protein.
Quotes
"FoodLMM ist der erste einheitliche und multitaskfähige LMM im Lebensmittelbereich."
"FoodLMM erzielt Spitzenergebnisse in jeder einzelnen Aufgabe."