本文探討了缺失數據問題的因果和反事實觀點。
缺失數據問題通常被描述為一個統計模型,其中包括完整數據分佈和缺失機制。作者將這些模型重新定義為因果和反事實模型,以便利用因果推論理論。
作者介紹了有向無環圖(DAG)在因果推論中的應用,包括統計DAG模型和因果DAG模型。這為後續討論缺失數據DAG模型奠定了基礎。
作者定義了缺失數據DAG模型(m-DAG),並將其視為因果DAG模型的特例。m-DAG對變量之間的關係施加了一些額外限制,以反映缺失數據的特點。
作者討論了在m-DAG模型下識別完整數據分佈的方法。雖然m-DAG模型與因果DAG模型有相似之處,但也存在一些關鍵差異,使得可以開發出專門針對缺失數據的識別理論。
作者還介紹了m-DAG模型的層次結構,包括完全隨機缺失(MCAR)、隨機缺失(MAR)和非隨機缺失(MNAR)等不同類型的缺失機制。這為理解不同缺失模型的識別提供了框架。
最後,作者舉例說明了一些具體的m-DAG模型,如置換模型、並行分塊模型和順序分塊模型等,展示了m-DAG如何編碼各種MNAR機制。
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by Razieh Nabi,... kl. arxiv.org 10-01-2024
https://arxiv.org/pdf/2210.05558.pdfDybere Forespørgsler