Der Artikel stellt einen Ansatz für föderiertes Lernen vor, der auf einem zweistufigen Reinforcement-Learning-Verfahren basiert. In der ersten Phase wird ein Mechanismus zur Auswahl vertrauenswürdiger Kunden entwickelt, um schädliche Modelle von der Fusionierung auszuschließen. In der zweiten Phase wird eine adaptive Methode zur Modell-Gewichtung eingeführt, die die Gewichte dynamisch basierend auf der Modellqualität zuweist, um die Genauigkeit des globalen Modells zu verbessern.
Der Ansatz wurde in fünf verschiedenen Modell-Fusionsszenarien evaluiert, die unterschiedliche Arten von Angriffen und Qualitätsschwankungen der Modelle simulieren. Die Ergebnisse zeigen, dass der Ansatz die Zuverlässigkeit signifikant erhöht, ohne dabei die Genauigkeit zu beeinträchtigen.
In eine andere Sprache
aus dem Quellinhalt
arxiv.org
Wichtige Erkenntnisse aus
by Leiming Chen... um arxiv.org 03-20-2024
https://arxiv.org/pdf/2307.13716.pdfTiefere Fragen