Großes Sehen-Sprache-Modell RelationVLM: Verständnis visueller Beziehungen ermöglichen
RelationVLM, ein großes Sehen-Sprache-Modell, das die Fähigkeit besitzt, verschiedene visuelle Beziehungen wie semantische Beziehungen, zeitliche Zusammenhänge und geometrische Transformationen präzise zu verstehen und zu verarbeiten.