핵심 개념
Catapults in SGD führen zu besserer Generalisierung durch Feature-Learning.
통계
Wir zeigen, dass kleinere Batch-Größe in SGD zu höherer AGOP-Ausrichtung und kleinerem Testverlust führt.
Die Anzahl der Catapults nimmt mit abnehmender Batch-Größe zu.
AGOP-Ausrichtung korreliert stark mit Testleistung.
인용구
"Catapults führen zu besserer Generalisierung durch erhöhte Ausrichtung mit AGOP."