Centrala begrepp
Methoden zur Identifizierung und Schätzung des optimalen Prädiktors in der Zieldomäne unter Verwendung von Proxyvariablen und Konzeptvariablen, ohne die Verteilung der latenten Variable explizit modellieren zu müssen.
Sammanfattning
Die Studie befasst sich mit dem Problem der Domänenanpassung bei Verteilungsverschiebungen, bei denen die Verschiebung auf einer Änderung in der Verteilung einer unbeobachteten, latenten Variable beruht, die sowohl die Kovariaten als auch die Zielgrößen beeinflusst. In diesem Szenario gelten weder die Annahmen des Kovariatenverschiebens noch des Zielgrößenverschiebens.
Der Ansatz zur Anpassung verwendet proximale kausale Lernmethoden, eine Technik zur Schätzung kausaler Effekte in Situationen, in denen Proxyvariablen für unbeobachtete Störgrößen verfügbar sind. Es wird gezeigt, dass Proxyvariablen eine Anpassung an Verteilungsverschiebungen ohne explizite Rekonstruktion oder Modellierung latenter Variablen ermöglichen.
Zwei Szenarien werden betrachtet: (i) Konzeptflaschenhals: Eine zusätzliche "Konzept"-Variable wird beobachtet, die die Beziehung zwischen den Kovariaten und den Zielgrößen vermittelt; (ii) Mehrdomänen: Trainingsdaten aus mehreren Quelldomänen sind verfügbar, wobei jede Quelldomäne eine andere Verteilung über der latenten Störgröße aufweist. Für beide Szenarien wird ein zweistufiger Kernschätzansatz entwickelt, um komplexe Verteilungsverschiebungen anzupassen. In den Experimenten zeigt sich, dass der Ansatz andere Methoden, insbesondere solche, die die latente Störgröße explizit rekonstruieren, übertrifft.
Statistik
Die Verteilung der latenten Variable U unterscheidet sich zwischen Quell- und Zieldomäne: PpUq ‰ QpUq.
Die bedingte Verteilung aller Variablen V gegeben U ist über die Domänen hinweg invariant: PpV | Uq " QpV | Uq für V Ď tW, X, C, Yu.
Citat
"Unser Ansatz zur Anpassung verwendet proximale kausale Lernmethoden, eine Technik zur Schätzung kausaler Effekte in Situationen, in denen Proxyvariablen für unbeobachtete Störgrößen verfügbar sind."
"Es wird gezeigt, dass Proxyvariablen eine Anpassung an Verteilungsverschiebungen ohne explizite Rekonstruktion oder Modellierung latenter Variablen ermöglichen."