Durch den Einsatz von Retrieval-Unterstützter Generierung (RAG) kann die Qualität der strukturierten Ausgaben, die Arbeitsabläufe darstellen, deutlich verbessert und die Halluzination reduziert werden. RAG ermöglicht auch den Einsatz kleinerer Sprachmodelle, ohne dass die Leistung beeinträchtigt wird.
Generative KI-Modelle müssen so entwickelt werden, dass sie verantwortungsvoll und sicher eingesetzt werden können. Dies erfordert die Berücksichtigung von fünf Schlüsselaspekten: Erzeugung wahrheitsgetreuer Inhalte, Vermeidung toxischer Inhalte, Ablehnung schädlicher Anweisungen, Verhinderung des Lecks von Trainingsdaten und Kennzeichnung generierter Inhalte.
Unser Comp4D-Rahmenwerk ermöglicht die Erstellung kompositonaler 4D-Szenen, indem es die 4D-Szene in individuelle 4D-Objekte und deren Interaktionen zerlegt. Im Gegensatz zu herkömmlichen Methoden, die eine singuläre 4D-Darstellung der gesamten Szene erzeugen, konstruiert Comp4D jedes 4D-Objekt in der Szene separat.
Die Studie zeigt, dass kontrafaktische Bildbearbeitung, bei der Bilder so verändert werden, als wären bestimmte Merkmale anders, nicht allein aus beobachteten Bilddaten und deren Etiketten berechnet werden kann. Selbst wenn die kausalen Beziehungen zwischen latenten Faktoren und Bildern bekannt sind, können keine Garantien für die Ausgabe des Modells gegeben werden. Die Autoren schlagen eine Annäherung an dieses herausfordernde Problem vor, indem sie nicht-identifizierbare kontrafaktische Verteilungen durch eine neue Familie von kontrafaktisch-konsistenten Schätzern approximieren.
Die Studie formalisiert die kontrafaktische Bildbearbeitung mithilfe von Strukturkausalmodellen (SCMs) und zeigt, dass kontrafaktische Bildverteilungen aus reinen Beobachtungsdaten nicht identifizierbar sind. Um dieses Problem zu lösen, wird eine neue Familie von kontrafaktisch-konsistenten Schätzern entwickelt, die die kausalen Zusammenhänge zwischen Merkmalen bei der Bildmanipulation berücksichtigen.