In dieser Arbeit stellen wir ICELUT vor, den ersten rein auf Lookup-Tabellen basierenden Bildverbesserer. Wir zeigen, dass die Anzahl der Eingangskanäle entscheidend für die Leistung ist und verwenden daher vollständig punktweise Faltungskernel, die eine anschließende Umwandlung in Lookup-Tabellen begünstigen. Eine neuartige aufgeteilte vollständig verbundene Schicht wird entwickelt, um die Größe der Lookup-Tabelle effektiv zu unterdrücken, ohne die Leistung zu beeinträchtigen.
Im Laufe der Entwicklung von ICELUT entdecken wir, dass ein kleines Rezeptionsfeld, im Extremfall 1 × 1, Robustheit gegenüber niedrigauflösenden Eingaben sowohl für das Training als auch für die Inferenz verleihen kann. Inspiriert von dieser Erkenntnis wird in ICELUT ein beispielloses 32 × 32 herunterskaliertes Bild für eine extreme Geschwindigkeit bei minimalem Leistungsabfall verwendet.
Durch den koordinierten Einsatz dieser neuartigen Designs erreicht unser rein auf Lookup-Tabellen basierendes Schema eine bemerkenswerte Latenz von 0,4 ms (7 ms) auf der GPU (CPU) bei nahezu gleichwertiger Leistung wie der aktuellen Spitzentechnologie und reduziert den Stromverbrauch auf ein vernachlässigbares Maß im Vergleich zu allen anderen CNN-Lösungen.
Para outro idioma
do conteúdo fonte
arxiv.org
Principais Insights Extraídos De
by Sidi Yang,Bi... às arxiv.org 03-29-2024
https://arxiv.org/pdf/2403.19238.pdfPerguntas Mais Profundas