本文提出了一種名為Multimodal Pretraining DEL-Fusion (MPDF)的新模型,以提高DNA編碼化合物庫(DEL)數據的去雜訊能力。
首先,MPDF通過預訓練任務,利用化合物圖、ECFP和文本描述之間的對比學習目標,增強了化合物編碼器的能力,使其能夠捕捉更豐富的化合物特徵。
其次,MPDF提出了一種DEL-Fusion框架,將化合物的原子級、亞分子級和分子級信息融合在一起,利用雙線性交互作用捕捉不同尺度之間的相關性,從而獲得更加全面的化合物表示。
實驗結果表明,與現有方法相比,MPDF在三個噪聲較大的DEL數據集上表現出更優異的去雜訊性能,特別是在識別活性化合物方面,AUPRC指標顯著提高。這表明MPDF能夠更好地從複雜的生物系統中提取有價值的化合物信息,為藥物發現帶來新的洞見。
Egy másik nyelvre
a forrásanyagból
arxiv.org
Mélyebb kérdések