Talaria: Interaktives Optimieren von Machine-Learning-Modellen für effiziente Inferenz
Talaria ermöglicht es ML-Praktikern, Modelle für die Hardware zu kompilieren, deren Hardware-Statistiken interaktiv zu visualisieren und eine Reihe von Optimierungen zu simulieren, um die Inferenzeffizienz zu verbessern.