這篇文章介紹了OmniBioTE,這是一系列首次出現的多組學生物序列基礎模型。主要內容包括:
OmniBioTE能夠自發地學習到核酸和蛋白質序列之間的聯合表示,即使在訓練過程中從未被明確地教授這些關係。最大規模的OmniBioTE模型甚至能夠自發地學習到分子生物學的中心法則。
通過對OmniBioTE進行細調,它能夠在預測肽-核酸結合親和力(∆G)和突變對結合親和力的影響(∆∆G)等多組學任務上取得最先進的結果。值得注意的是,在進行這些任務的細調過程中,OmniBioTE自發地學習到了有意義的結構信息,而這些信息是完全從原始序列數據中獲得的,而不需要任何先前的結構訓練。
與僅在單一組學數據上訓練的模型相比,OmniBioTE在單一組學下游任務上的表現並未顯著下降,這表明訓練多組學數據並不會對模型性能造成負面影響。
總的來說,OmniBioTE展示了多組學生物序列建模的巨大潛力,可以幫助我們更好地理解和預測生物分子之間的複雜相互作用。
翻译成其他语言
从原文生成
arxiv.org
更深入的查询