Kontinuierliche Objektzustandserkennung für Kochroboter mit vortrainierten Vision-Sprache-Modellen und Black-Box-Optimierung
Kontinuierliche Erfassung der Zustandsänderungen von Lebensmitteln beim Kochen durch Analyse der gesprochenen Sprache unter Verwendung von vortrainierten großen Vision-Sprache-Modellen und Black-Box-Optimierung zur Verbesserung der Genauigkeit und Robustheit.