Core Concepts
Die Verwendung von niedrigdimensionalen Darstellungen in Methoden zur Schätzung des bedingten durchschnittlichen Behandlungseffekts (CATE) kann zu einer durch die Darstellung induzierten Konfundierungsverzerrung führen. Wir schlagen einen neuen, darstellungsunabhängigen Widerlegungsrahmen vor, um Grenzen für diese Verzerrung zu schätzen.
Abstract
Der Artikel befasst sich mit der Schätzung des bedingten durchschnittlichen Behandlungseffekts (CATE) aus Beobachtungsdaten unter Verwendung von Repräsentationslernen. Repräsentationslernen-Methoden haben den Vorteil, dass sie oft state-of-the-art-Leistung erzielen, insbesondere in Situationen mit geringer Stichprobengröße. Sie erreichen dies, indem sie die Varianz der CATE-Schätzung durch die Verwendung einer (möglicherweise eingeschränkten) niedrigdimensionalen Darstellung reduzieren.
Allerdings können niedrigdimensionale (möglicherweise eingeschränkte) Darstellungen Informationen über Kovariaten, einschließlich Informationen über tatsächliche Störfaktoren, verlieren. Dies kann zu einer durch die Darstellung induzierten Konfundierungsverzerrung (RICB) führen, wodurch die Gültigkeit des Repräsentationslernens für die CATE-Schätzung in der Regel verletzt ist.
Der Artikel führt zunächst den Begriff der durch die Darstellung induzierten Konfundierungsverzerrung ein und zeigt, unter welchen Bedingungen der CATE aufgrund der RICB nicht identifizierbar ist. Als Lösung schlagen die Autoren einen neuen, darstellungsunabhängigen Widerlegungsrahmen vor, um Grenzen für die durch die Darstellung induzierte Konfundierungsverzerrung zu schätzen. Dazu führen sie ein partielles Identifikationsverfahren durch, um untere und obere Grenzen des RICB zu schätzen.
Die Autoren demonstrieren die Effektivität ihrer Grenzen in einer Reihe von Experimenten, indem sie sie mit einer Vielzahl von state-of-the-art-CATE-Methoden kombinieren. Sie zeigen, dass Entscheidungen, die auf unseren Grenzen für den RICB basieren, genauer sind als Entscheidungen, die auf den ursprünglichen CATE-Schätzungen basieren.
Stats
Die Verwendung von niedrigdimensionalen Darstellungen kann zu einem Verlust von Informationen über beobachtete Störfaktoren führen und somit zu einer Verzerrung.
Die durch die Darstellung induzierte Konfundierungsverzerrung kann dazu führen, dass der bedingte durchschnittliche Behandlungseffekt nicht identifizierbar ist.
Quotes
"Niedrigdimensionale (möglicherweise eingeschränkte) Darstellungen können Informationen über beobachtete Störfaktoren verlieren und so zu einer Verzerrung führen, wodurch die Gültigkeit des Repräsentationslernens für die CATE-Schätzung in der Regel verletzt ist."
"Als Lösung schlagen wir einen neuen, darstellungsunabhängigen Widerlegungsrahmen vor, um Grenzen für die durch die Darstellung induzierte Konfundierungsverzerrung zu schätzen."