Verteidigung gegen indirekte Prompt-Injektions-Angriffe mit Spotlighting
Spotlighting, eine Familie von Prompt-Engineering-Techniken, kann die Fähigkeit von Sprachmodellen verbessern, zwischen gültigen Systemanweisungen und unsicheren externen Eingaben zu unterscheiden, um so Prompt-Injektions-Angriffe abzuwehren.