本研究探討了將歸納邏輯程式設計(ILP)和主動學習應用於複雜的生物系統的可行性。我們提出了一種新的方法,稱為布林矩陣邏輯程式(BMLP),利用布林矩陣作為底層的評估機制,來擴展ILP的應用範圍,以學習大規模代謝網絡模型(GEM)中的雙基因互作。
具體來說,我們將大腸桿菌(E. coli)的GEM模型iML1515編碼為一個邏輯程式,其中包含1515個基因和2719個代謝反應。在iML1515中,基因對之間的互作被認為是一個主要的錯誤來源。學習這些互作需要探索一個組合假說空間。由於生物關係通常以邏輯方式描述,ILP特別擅長處理生物知識庫。
我們提出了BMLP,利用布林矩陣作為底層的評估機制來計算具有最多兩個體字面和最多兩個體字面的遞歸datalog程式。為了從組合假說空間高效地學習,我們創建了一個主動學習系統BMLPactive,使用BMLP-IE模塊來學習雙基因互作,所需的實驗次數比隨機實驗少90%。
我們將BMLPactive應用於學習關鍵基因tyrB在色氨酸生物合成通路中的功能。結果表明,BMLPactive能夠以極少的實驗次數成功恢復正確的基因功能,顯著減少了所需的實驗次數,相比隨機實驗選擇更有效。這證明了BMLPactive在學習GEM中雙基因互作方面的潛力,即使實驗設計空間呈指數級增長,它仍然表現出色。
Till ett annat språk
från källinnehåll
arxiv.org
Djupare frågor