Der WMDP-Benchmark: Messung und Reduzierung von bösartiger Nutzung durch Unlearning
Der WMDP-Benchmark dient als Maß für gefährliches Wissen in den Bereichen Bio-, Cyber- und Chemiesicherheit und bietet eine Grundlage für die Reduzierung bösartiger Nutzung durch Unlearning.