Präzise und effiziente Erkennung von feingranularen Lebensmitteln durch ein Gaussian- und kausales Aufmerksamkeitsmodell
Ein neuartiges Gaussian- und kausales Aufmerksamkeitsmodell (GCAM) wird vorgestellt, um die Konzentration des Netzwerks auf Objektpositionen durch das Training einer Gaussian-Verteilungskarte der Objektpositionen und die gemeinsame Gewichtung mit globalen Merkmaleingaben zu verbessern. Darüber hinaus wird ein kausaler Graph und eine Verlustfunktion konstruiert, um die Qualitätsverbesserung des Aufmerksamkeitsmechanismus des Netzwerks zu quantifizieren und seine Anfälligkeit für Datendrift zu reduzieren.