核心概念
本研究提出GenMIND,一個基於核密度估計(KDE)的生成模型,可以合成具有真實數據統計特性的神經影像區域體積數據。GenMIND可以生成18,000個涵蓋成人生命週期的合成樣本,並提供了生成模型本身,以滿足研究人員的定制需求。
摘要
本研究提出了GenMIND,一個基於核密度估計(KDE)的生成模型,用於合成具有真實數據統計特性的神經影像區域體積數據。
主要內容包括:
-
數據來源:使用iSTAGING consortium整合的40,000多個MRI掃描,提取145個腦部區域體積特徵,並按種族和性別分組。
-
生成模型:為每個種族和性別組別訓練一個獨立的KDE模型,學習年齡和區域體積的聯合分布。通過從這些模型中採樣,可以生成新的合成數據。
-
數據集:生成18,000個涵蓋成人生命週期的合成樣本,包含區域體積、年齡、性別和種族信息。同時提供了生成模型本身,以供研究人員定制使用。
-
驗證:通過統計分析和機器學習模型,驗證了合成數據與真實數據在分布和協變量預測能力上的高度相似性。並展示了合成數據在腦齡預測和數據增強等實際應用中的價值。
GenMIND旨在為神經影像研究提供一個有價值的合成數據資源,有助於解決真實數據獲取和隱私限制的問題,促進機器學習模型在醫療領域的應用。
統計資料
合成樣本的3rd Ventricle體積為572.7620447毫升。
合成樣本的Right Accumbens Area體積為438.5023773毫升。
合成樣本的年齡為83.49359824歲。
引述
"GenMIND, a comprehensive structural brain imaging generator and dataset, aims to significantly contribute to advancing machine learning research within the field of neuroimaging."
"Beyond brain age prediction, the synthetic data generated by GenMIND can also be leveraged to train other machine learning models and adapt them for smaller-scale studies through techniques like transfer learning or domain adaptation."