核心概念
本稿では、HIVに感染した小児の薬物動態学的データにおける欠損データの影響を、因果グラフを用いて分析し、因果効果の回復可能性を評価しています。特に、欠損メカニズムが「クローズド」である場合、MNARであっても、利用可能なケース分析が有効であることを示しています。
要約
書誌情報
Holovchak, A., McIlleron, H., Denti, P., & Schomaker, M. (2024). Recoverability of Causal Effects under Presence of Missing Data: a Longitudinal Case Study. arXiv preprint arXiv:2402.14562v3.
研究目的
本研究は、HIVに感染した小児におけるエファビレンツの血漿中濃度がウイルス抑制に与える因果関係を、欠損データが存在する状況下で推定することを目的としています。
方法
- CHAPAS-3試験に参加した、エファビレンツベースのレジメンで治療を受けたHIV感染小児125人のデータを使用。
- 欠損データの理由に関する臨床医の知識を、欠損値インジケータを用いた因果グラフ(m-DAG)に体系化。
- 因果効果の識別可能性を評価し、m-DAGに基づいて回復可能性を分析。
- 2つの主要な因果効果、すなわち36週後と84週後のウイルス負荷に対するエファビレンツ濃度の影響を推定。
- 欠損データに対処するために、利用可能なケース分析と多重代入法を用いて分析を実施。
主な結果
- 提案された因果モデル(Gmain)の下では、欠損メカニズムが「クローズド」であるため、利用可能なケース分析が有効であることが判明。
- 利用可能なケース分析の結果、エファビレンツ濃度が低いほどウイルス抑制失敗の可能性が高く、これは予想される結果と一致。
- 多重代入法を用いた分析では、利用可能なケース分析と比較して、因果関係の推定値が過小評価される傾向が見られた。
結論
本研究は、複雑な縦断的データにおける欠損データの影響を評価するための因果グラフの有用性を示しました。特に、欠損メカニズムが「クローズド」である場合、MNARであっても、利用可能なケース分析が有効であることが示唆されました。
意義
本研究は、欠損データが存在する状況下での因果推論における重要な問題に取り組んでおり、特にHIVのような複雑な疾患の治療効果を評価する上で重要な意味を持ちます。
限界と今後の研究
- 本研究では、臨床医の知識に基づいて欠損データの理由をモデル化しましたが、他の未測定の交絡因子の可能性は排除できません。
- 今後の研究では、より多くのデータを用いて、提案された因果モデルの妥当性を検証する必要があります。
統計
データは、ウガンダとザンビアの4つの施設で実施されたCHAPAS-3試験の125人のHIV感染小児から収集されました。
小児は1ヶ月から13歳までの年齢で、エファビレンツベースの抗レトロウイルス療法を受けていました。
主要な評価項目は、ウイルス学的失敗(ウイルス量> 100コピー/ mL)と定義されました。
エファビレンツ濃度、ウイルス量、アドヒアランス、体重などの変数に欠損データが存在していました。
引用
"Missing data in multiple variables is a common issue."
"Our analyses demonstrate an innovative application of missingness DAGs to complex longitudinal real-world data, while highlighting the sensitivity of the results with respect to the assumed causal model."
"In practice, MAR is often assumed and multiple imputation is performed, which in many cases may lead to biased estimation results."