Ein neuartiges Rahmenwerk für Auktionen, bei denen Werbeinhalte von einem Großsprachmodell (LLM) zusammengefasst werden, um eine effiziente und anreizkompatible Allokation zu erreichen.
Das vorgeschlagene Verfahren kombiniert eine trajektorienbasierte Exploration und Ausbeutung, um die Leistung von iterativem Offline-Reinforcement Learning für automatisches Bieten in Online-Werbung zu verbessern. Zusätzlich wird ein sicheres Explorationsverfahren entwickelt, um die Sicherheit des Trainingsprozesses zu gewährleisten.
In dieser Arbeit entwickeln wir einen formalen Rahmen für die differenzial-private Messung von Werbekonversionen, bei der ein Werbetreibender die Werbekonversionen schätzen möchte, die Nutzern auf verschiedenen Verlagswebsites zugeordnet werden können.