本文提出了TrialSynth,這是一種結合變分自編碼器(VAE)和Hawkes過程的方法,用於生成高保真度的序列性臨床試驗數據。
臨床試驗數據是一種寶貴的資源,可用於指導藥物開發,但由於隱私和法律限制,這些數據通常難以獲取。生成高質量的合成臨床試驗數據可以幫助共享和應用這些數據。
雖然已有一些方法可以生成靜態背景的合成臨床試驗數據,但生成包含時間序列信息的細粒度合成數據仍然是一個挑戰。這些時間序列信息對於優化試驗設計和預防有害不良事件非常重要。
TrialSynth利用Hawkes過程來捕捉事件類型和時間間隔的預測,這對於模擬序列性臨床試驗數據的結構非常適合。此外,TrialSynth還支持指定生成特定事件類型的功能。
實驗結果表明,TrialSynth在7個真實世界臨床試驗數據集上優於其他可生成序列性數據的方法,在保真度和生成高精確度事件序列方面表現出色,即使在訓練數據量較小的情況下也是如此。
TrialSynth不僅在生成數據的效用方面優於現有方法,而且在保護患者隱私方面也有出色的表現。
In eine andere Sprache
aus dem Quellinhalt
arxiv.org
Wichtige Erkenntnisse aus
by Chufan Gao, ... um arxiv.org 09-12-2024
https://arxiv.org/pdf/2409.07089.pdfTiefere Fragen