Der Artikel befasst sich mit der Herausforderung der Genregulationsnetzwerk-Inferenz (GRNI) in Einzelzell-RNA-Sequenzierungsdaten, die durch das Auftreten von Dropouts beeinträchtigt werden. Dropouts sind technische Nullwerte, die durch den Sequenzierungsprozess entstehen und die gemeinsame Verteilung der gemessenen Genexpressionen verzerren können.
Der Artikel führt zunächst ein kausales grafisches Modell, das Causal Dropout Model (CDM), ein, um die Dropout-Mechanismen zu charakterisieren. Trotz der Unidentifizierbarkeit der wahren Verteilung ohne Dropouts zeigt der Artikel, dass die bedingten Unabhängigkeitsbeziehungen in den Daten nach dem Löschen der Proben mit Nullwerten für die bedingten Variablen asymptotisch identisch mit den bedingten Unabhängigkeitsbeziehungen in den ursprünglichen Daten ohne Dropouts sind.
Basierend auf dieser Erkenntnis wird ein Verfahren zur testweisen Löschung vorgestellt, bei dem Conditional-Independence-Tests nur auf den Proben ohne Nullwerte für die bedingten Variablen durchgeführt werden. Dieses Verfahren kann nahtlos in bestehende Strukturlernverfahren, einschließlich constraint-basierter und gieriger scorebasierter Methoden, integriert werden, um eine prinzipielle Lösung für die GRNI-Inferenz in Gegenwart von Dropouts zu liefern.
Der Artikel zeigt auch, dass das kausale Dropout-Modell aus den Daten validiert werden kann und dass viele bestehende statistische Modelle zur Handhabung von Dropouts als spezifische parametrische Instanzen in unser Modell passen.
Umfangreiche empirische Evaluierungen auf synthetischen, kuratierten und realen experimentellen Transkriptom-Datensätzen belegen die Wirksamkeit des vorgeschlagenen Ansatzes.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Haoyue Dai,I... at arxiv.org 03-26-2024
https://arxiv.org/pdf/2403.15500.pdfDeeper Inquiries