핵심 개념
DomainLab ist ein modulares Python-Paket, das es Nutzern ermöglicht, die Vorteile verschiedener Methoden zur Domänen-Generalisierung mit minimalem Aufwand für die Reproduzierbarkeit zu kombinieren.
초록
DomainLab ist ein modulares Python-Paket, das darauf ausgelegt ist, maximale Modularität zu erreichen. Es bietet verschiedene Möglichkeiten, um Aufgaben (Tasks) zu spezifizieren, die Datensätze aus unterschiedlichen Domänen sammeln und das Szenario der Domänen-Generalisierung definieren.
Das Paket verwendet ein entkoppeltes Design, das es ermöglicht, neuronale Netze von der Konstruktion von Regularisierungsverlusten zu trennen. Hierarchische Kombinationen von neuronalen Netzen, verschiedenen Methoden zur Domänen-Generalisierung und zugehörigen Hyperparametern können zusammen mit anderen experimentellen Einstellungen in einer einzigen Konfigurationsdatei angegeben werden.
Darüber hinaus bietet DomainLab leistungsfähige Benchmark-Funktionalitäten, um die Generalisierungsleistung neuronaler Netze auf Daten außerhalb der Verteilung zu bewerten. Das Paket unterstützt das Ausführen des spezifizierten Benchmarks auf einem HPC-Cluster oder auf einem eigenständigen Rechner.
Das Paket ist gut getestet, mit einer Abdeckung von über 95 Prozent, und gut dokumentiert. Aus Nutzersicht ist es für Modifikationen geschlossen, aber für Erweiterungen offen.
통계
"Viele Methoden zur Domänen-Generalisierung verwenden einen Strukturellen Risiko-Minimierungs (SRM)-ähnlichen Verlust ℓ(b(θ); ξ ∼Dtr) + µT R(b(θ); ξ ∼Dtr), wobei ℓ(b(θ); ξ ∼Dtr) den aufgabenspezifischen Verlust (z.B. Kreuzentropieverlust für Klassifikation) und R(b(θ); ξ ∼Dtr) Regularisierungsverlust-Vektoren als Strafterm zur Steigerung der Domänen-Invarianz darstellt."
"Hier repräsentiert µ den Multiplikatorvektor, um die Wichtigkeit der beiden Verlustterme zu gewichten. Wir verwenden θ, um die Gewichte des neuronalen Netzes darzustellen, und b(θ), um eine bestimmte neuronale Netzwerkarchitektur, z.B. Vision Transformer, ResNet oder AlexNet, darzustellen, die Eingaben aus einem Datenraum in einen Merkmalsraum abbilden kann. ξ ∼Dtr steht für Mini-Batches ξ aus den Trainingsbereichen Dtr."
인용구
"DomainLab wurde entworfen, um maximale Modularität zu erreichen."
"Das entkoppelte Design von DomainLab ermöglicht es, Modell-Regularisierung R(b(θ); ξ ∼Dtr) mit Trainer-Regularisierung Tθ zu kombinieren, sowie Trainer mit Trainer zu dekorieren."