Kernkonzepte
Mamba4Rec adressiert die Effektivitäts-Effizienz-Dilemma in sequenziellen Empfehlungen durch selektive Zustandsraummodelle.
Zusammenfassung
Einleitung:
Sequential Recommendation und Herausforderungen mit Transformer-Modellen.
Mamba4Rec:
Vorstellung von Mamba4Rec und seine Effizienz und Effektivität.
Verwendung von State Space Models und Mamba-Blöcken.
Experimente:
Datasets, Baselines, Metriken und Implementierungsdetails.
Leistungsvergleich von Mamba4Rec mit anderen Modellen.
Effizienz:
Vergleich der Effizienz von Mamba4Rec mit Transformer-Modellen.
Ablationsstudie:
Analyse der Auswirkungen von Positionalem Embedding, Layer-Normalisierung, Feed-Forward-Netzwerk und Mamba-Blöcken.
Schlussfolgerung und zukünftige Arbeit:
Erfolge von Mamba4Rec und zukünftige Entwicklungsrichtungen.
Statistiken
Mamba4Rec erreicht eine NDCG@10 von 0.1822 auf MovieLens-1M.
Mamba4Rec benötigt 4.82GB GPU-Speicher im Vergleich zu 15.48GB bei BERT4Rec.
Training von Mamba4Rec dauert 75.52s pro Epoche.
Zitate
"Mamba4Rec adressiert die Effektivitäts-Effizienz-Dilemma in sequenziellen Empfehlungen durch selektive Zustandsraummodelle."