Core Concepts
Effiziente Verarbeitung von neuronalen Netzwerkkernen durch SNNKs.
Abstract
Abstract:
Einführung von skalierbaren neuronalen Netzwerkkernen (SNNKs) als Ersatz für reguläre Feedforward-Schichten (FFLs).
SNNKs entwirren Eingaben von den Parametern des neuronalen Netzwerks in der FFL.
Vorstellung des neuronalen Netzwerkbündelungsprozesses zur Kompaktierung von tiefen neuronalen Netzwerkarchitekturen.
Theoretische Analyse und empirische Bewertung der Konzepte.
Einleitung:
Kernelmethoden sind theoretisch fundierte Ansätze im maschinellen Lernen.
Rahimi & Recht (2007) schlugen die Konstruktion einer zufälligen Merkmalszuordnung vor, um die Berechnungskomplexität zu reduzieren.
Mit dem Aufkommen von neuronalen Netzwerken sind diese in vielen ML-Anwendungen dominierend.
Skalierbare neuronale Netzwerkkerne (SNNKs):
SNNKs entwirren Eingaben von Parametern und verbinden sie nur in der Endberechnung über den Punktprodukt-Kernel.
Der Bündelungsprozess ermöglicht die Kompaktierung von NNs und führt zu reduzierter Anzahl trainierbarer Parameter.
SNNKs sind streng ausdrucksstärker als reguläre FFLs und ermöglichen die Modellierung komplexer Beziehungen.
Universelle zufällige Merkmale (URFs):
Neue begrenzte zufällige Merkmalsmechanismen zur Schätzung von Funktionen.
Kombination von Fourier-Analysetechniken mit Methoden zur Schätzung von Softmax-Kernels.
Experimente:
Umfangreiche empirische Bewertung von SNNKs, von der punktweisen Kernelabschätzung bis zum Feintuning von Transformers mit Adapter-Schichten.
Bis zu 5-fache Reduzierung der trainierbaren Parameter bei wettbewerbsfähiger Genauigkeit.
Stats
Kernelregression hat eine Zeitkomplexität von O(N^3).
RF-Mechanismen können die Berechnungskomplexität reduzieren, wenn m << N.
SNNKs bieten bis zu 5-fache Reduzierung der trainierbaren Parameter.
Quotes
"SNNKs entwirren Eingaben von Parametern und verbinden sie nur in der Endberechnung über den Punktprodukt-Kernel."
"Der Bündelungsprozess ermöglicht die Kompaktierung von NNs und führt zu reduzierter Anzahl trainierbarer Parameter."