Visuelle Präferenzableitung: Eine bildsequenzbasierte Präferenzanalyse in der Tischplattenobjektmanipulation
Unser Ansatz, die Chain-of-Visual-Residuals (CoVR)-Methode, ermöglicht es, Benutzervorlieben aus einer Sequenz von Bildern in Tischplattenobjektmanipulationsaufgaben abzuleiten, indem er sowohl semantische als auch geometrische Eigenschaften der Objekte berücksichtigt.