本研究論文介紹了一個名為 ukbFGSEA 的 R 語言套件,旨在應用快速預排序基因集富集分析 (FGSEA) 於英國生物銀行 (UK Biobank) 的外顯子組數據。該套件旨在填補目前缺乏將 GSEA 應用於 Genebass 數據(一個包含基因與 4,529 種表現型之間關聯的數據集)的空白。
ukbFGSEA 套件利用 Genebass 數據集,並提供三種主要功能:
fgsea
包中的 fgseaMultilevel()
函數處理排序後的數據集。ukbfgsea
的應用擴展到多種表現型,允許同時對數十萬種表現型運行 FGSEA。map_ukbfgsea()
的原始輸出,並以簡潔的格式組織結果。為了證明 ukbFGSEA 的效用,研究人員將 map_ukbfgsea()
函數應用於與自閉症譜系障礙 (ASD185)、發育障礙 (DD477) 和神經發育障礙 (NDD664) 相關的三個基因集。他們過濾了表現型並專注於功能喪失 (LoF) 突變,以分析 1,603 種表現型。
分析結果證實了先前已知的關聯,例如癲癇和恐慌症與自閉症之間的關係,並揭示了新的關聯,例如自閉症與肩峰下減壓術、腕隧道症候群和膝關節置換術等醫療手術之間的關係。此外,研究結果還突出了發育障礙和神經發育障礙基因與各種表現型之間的關聯,包括已知的關聯(如癲癇和白內障)和新的關聯(如肩峰下減壓術和炎症性腸病治療)。
ukbFGSEA R 包有效地將 FGSEA 應用於 Genebass 數據集,彌合了關鍵的方法學差距。通過驗證已知關聯和發現新關聯,ukbFGSEA 展示了其在增進我們對英國生物銀行中複雜表現型的理解方面的潛力。該工具功能強大、用戶友好,並且能夠產生重要的遺傳學見解。
翻譯成其他語言
從原文內容
arxiv.org
深入探究