本文提出了DeepProtein,這是一個專門為蛋白質相關任務設計的綜合性和用戶友好型深度學習庫。DeepProtein集成了多種最先進的神經網絡架構,包括卷積神經網絡(CNN)、循環神經網絡(RNN)、變形金剛、圖神經網絡(GNN)和圖變形金剛(GT)。它提供了用戶友好的接口,方便領域研究人員將深度學習技術應用於蛋白質數據。此外,我們還建立了一個基準,評估這些神經架構在各種蛋白質任務上的性能,包括蛋白質功能預測、蛋白質定位預測和蛋白質-蛋白質相互作用預測,展示了其出色的性能和可擴展性。
單染色體缺失會導致許多基因劑量減半,通常會伴隨著大幅降低適合度。然而,單染色體缺失株仍能存活並生長,顯示出極大且正向的基因互作成分,抵消了大部分個別負面效應的總和。
本文回顧了33種最新的計算方法,將空間變異性基因分為三類:整體、細胞類型特異性和空間域標記基因。本文解釋了這些方法背後的直觀原理,總結了它們的應用,並對它們使用的假設檢驗進行了分類,以平衡其一般性和特殊性。本文討論了空間變異性基因檢測的挑戰,並提出了未來改進的方向。
轉錄工廠的形態和組成主要由集群大小決定。小型集群通常由單一類型的轉錄因子組成,而大型集群則通常由多種類型的轉錄因子混合組成。
染色體是如何在細胞核內緊湊地組織而不會嚴重纏結的問題,正逐漸被理解,這要歸功於實驗技術的重大進步。聚合物模型可以重現接觸圖,並預測間期染色體的三維結構。數據驅動的方法利用接觸圖作為輸入,預測有絲分裂時染色體螺旋的手性反轉。使用實驗得到的染色質位點之間的有效相互作用,可以準確預測正常和反轉細胞核的結構。聚合物理論和模擬顯示,染色質位點的動力學表現出次擴散行為,但擴散指數分布很廣,與實驗結果一致。雖然粗粒化模型取得成功,但仍有許多具有挑戰性的問題需要解決,需要創造新的實驗和計算工具來理解基因組生物學。
本文對基於深度學習的RNA-蛋白質相互作用預測的整個過程進行了全面調查,包括特徵編碼、深度學習建模、結果評估、應用領域以及可用的網站和軟件。
提出一種名為Ut-SNE的新方法,能夠在降維可視化過程中有效地捕捉和表達單細胞RNA測序資料的不確定性,從而提供更準確和有洞見的生物學分析。
我們提出了一種新的方法,稱為布林矩陣邏輯程式(BMLP),利用布林矩陣作為底層的評估機制,來擴展歸納邏輯程式設計(ILP)的應用範圍,以學習大規模代謝網絡模型(GEM)中的雙基因互作。我們創建了一個主動學習系統BMLPactive,結合BMLP模塊BMLP-IE,能夠以較少的實驗次數成功學習到雙基因互作,相比隨機實驗大幅提高了效率。
本文提出了一個新的基準測試 ReactZyme,用於準確地註解酵素的催化反應,以克服現有註解系統的局限性。
我們開發了OmniBioTE,這是首次出現的多組學生物序列基礎模型。我們展示了這些模型能夠自發地學習到核酸和蛋白質序列之間的聯合表示,並能夠在不需要任何先前結構訓練的情況下,從純粹的序列數據中學習到有意義的結構信息。