Event-basierte Kameras und konventionelle RGB-Kameras können durch Fusion ihre jeweiligen Stärken kombinieren und Schwächen ausgleichen.
iKUN ermöglicht die Kommunikation mit Trackern ohne Neuschulung.
Die Entwicklung eines Topologie-Lernverfahrens zur Verbesserung des dezentralen föderierten Lernens über unzuverlässige D2D-Netzwerke.
Effiziente Bewertung von OPE-Estimatoren durch das Risiko-Rendite-Verhältnis.
Die Arbeit schlägt VL2V-ADiP vor, um die OOD-Generalisierung von Vision-Modellen zu verbessern, indem Vision-Sprachmodelle distilliert werden.
Ein tiefes generatives Framework für MILP-Instanzen ermöglicht die Generierung realistischer Instanzen zur Verbesserung von MILP-Lösern.
MovieChat überwindet Herausforderungen bei der Analyse langer Videos durch die Integration von Vision- und Sprachmodellen.
SENSEi optimizes GNN computations by dynamically selecting sparse-dense matrix compositions based on input attributes, achieving significant speedups.
Die Nutzung von synthetischen Daten verbessert die Leistung von EHOI-Erkennungsmethoden erheblich.
Effiziente Erkennung von adversen Audio-Samples in ASR-Systemen durch Analyse von Verteilungsmerkmalen.