核心概念
Durch den Einsatz von Diffusionsmodellen und der Einbindung von Leistungsprädiktoren kann DiffusionNAG effizient und gezielt neuronale Architekturen generieren, die bestimmte Zielkriterien erfüllen.
摘要
DiffusionNAG ist ein neuartiger prädiktorgesteuerter Rahmen zur Generierung neuronaler Architekturen, der einen Paradigmenwechsel von herkömmlichen neuronalen Architektursuche-Methoden (NAS) darstellt.
Zunächst wird ein unkonditionales Diffusionsmodell trainiert, um Architekturen aus dem Suchraum zu generieren. Anschließend wird dieses Modell durch einen trainierten Leistungsprädiktor gezielt gesteuert, um Architekturen mit den gewünschten Eigenschaften (z.B. hohe Genauigkeit oder Robustheit) zu erzeugen.
Im Vergleich zu herkömmlichen NAS-Methoden bietet DiffusionNAG folgende Vorteile:
- Effizientere Suche durch Fokussierung auf die relevanten Architekturen im Suchraum
- Überlegene Nutzung der Leistungsprädiktorinformationen sowohl für die Generierung als auch die Bewertung
- Einfache Anpassbarkeit an verschiedene Aufgaben durch Austausch der Prädiktormodelle
Umfangreiche Experimente in zwei prädiktorzentrierten NAS-Szenarien (Transferable NAS und BO-basiertes NAS) zeigen, dass DiffusionNAG deutlich bessere Leistung als bestehende Methoden erzielt, insbesondere in großen Suchräumen.
統計資料
DiffusionNAG erreicht auf dem CIFAR-10-Datensatz eine maximale Genauigkeit von 97,52%, was eine statistisch signifikante Verbesserung gegenüber den Vergleichsmethoden MetaD2A (97,45%) und TNAS (97,48%) darstellt.
Auf dem NAS-Bench-201-Suchraum benötigt DiffusionNAG nur 1-3 trainierte Architekturen, um die Höchstleistung auf den Datensätzen CIFAR-10, CIFAR-100, Aircraft und Oxford-IIIT Pets zu erreichen. Dies entspricht einer Beschleunigung von mindestens 15x und bis zu 35x im Vergleich zu den Baseline-Methoden.
引述
"DiffusionNAG kann flexibel Architekturen mit den gewünschten Eigenschaften für verschiedene Aufgaben generieren, indem es den Generierungsprozess mit dem parametrisierten Prädiktor steuert."
"DiffusionNAG zeigt überlegene Leistung im Vergleich zum traditionellen Ansatz, bei dem der gleiche Prädiktor nur für die Bewertungsphase verwendet wird."