Der Artikel befasst sich mit der robusten Schätzung von Heterogenität in faktoriellen Daten unter Verwendung von Rashomon-Partitionen.
Zunächst wird das Problem erläutert, bei dem es darum geht, wie sich das Ergebnis von Interesse mit Kombinationen beobachtbarer Kovariaten verändert. Bestehende Ansätze suchen entweder nach einer "optimalen" Partition unter bestimmten Annahmen oder versuchen, aus der Menge aller möglichen Partitionen zu stichproben. Beide Ansätze ignorieren jedoch die Realität, dass es, insbesondere bei Korrelationsstrukturen in den Kovariaten, viele statistisch ununterscheidbare Möglichkeiten gibt, den Kovariatenraum zu partitionieren, die jedoch sehr unterschiedliche Implikationen für Politik oder Wissenschaft haben.
Der vorgestellte Rashomon-Partitions-Set (RPS)-Ansatz bietet eine Alternative. Jeder Eintrag im RPS partitioniert den Faktorialraum der Kovariaten mit Hilfe einer baumartigen Geometrie. Der RPS umfasst alle Partitionen, deren Posteriorwerte in der Nähe des maximalen a posteriori-Wertes liegen, auch wenn sie inhaltlich sehr unterschiedliche Erklärungen liefern. Dabei wird ein Priorverteilung verwendet, die keinerlei Annahmen über die Zusammenhänge zwischen den Kovariaten macht - das ℓ0-Priorverteilung, die sich als minimax-optimal erweist.
Anhand von Simulationsexperimenten und drei empirischen Anwendungen (Spendenverhalten, Chromosomenstruktur, Mikrofinanzierung) wird gezeigt, wie der RPS-Ansatz robuste Schlussfolgerungen im Vergleich zu herkömmlichen Regularisierungstechniken ermöglicht. Der RPS liefert auch Erkenntnisse zur Generierung neuer wissenschaftlicher Theorien, indem über die Modelle im RPS hinweg konsistente Muster von Merkmalskombinationen und deren Auswirkungen auf das Ergebnis identifiziert werden.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Aparajithan ... at arxiv.org 04-03-2024
https://arxiv.org/pdf/2404.02141.pdfDeeper Inquiries