核心概念
DeepFM-Crispr是一個利用深度學習模型,結合大型語言模型和轉換器架構,來預測CRISPR-Cas13d系統的靶向效果和離靶效果的創新模型。
摘要
本文介紹了DeepFM-Crispr模型,該模型旨在預測CRISPR-Cas13d系統的靶向效果。
模型架構包括以下關鍵組件:
- 數據表示: 使用one-hot編碼將RNA序列轉換為二進制向量,作為模型的輸入。
- RNA大型語言模型: 採用RNA-FM模型,能夠有效提取RNA序列的潛在特徵,並利用注意力機制捕捉上下文信息。
- 二級結構預測: 使用ResNet模型預測RNA二級結構,並將其與序列特徵整合。
- 特徵整合與處理: 採用DenseNet和轉換器編碼器架構,進一步提取和優化特徵表示。
- 效果預測: 最終使用多層感知機(MLP)輸出sgRNA的預測效果得分。
實驗結果表明,DeepFM-Crispr在預測準確度和分類性能方面均優於傳統機器學習方法和最新的深度學習模型,顯示了其在CRISPR基因編輯應用中的潛力。
未來工作將把DeepFM-Crispr擴展到其他CRISPR系統,如Cas9和Cas12,以進一步提高靶向效果和降低離靶效果,為基因工程和醫療應用帶來更大的影響。
統計資料
"CRISPR-Cas系統已經徹底改變了生物技術和生物醫學科學的發展。"
"Cas13d系統因其旁路切割活性而特別引人注目,這一特性對其診斷和治療應用至關重要。"
"DeepFM-Crispr模型利用先進的轉換器架構和大型語言模型,能夠有效整合進化和結構信息,提高對Cas13d系統靶向效果的預測準確性。"
"與傳統機器學習方法和最新深度學習模型相比,DeepFM-Crispr在預測準確度和分類性能方面均有顯著提升。"
引述
"DeepFM-Crispr不僅匹配了DeepCas13在AUC指標上的最高表現,而且在精確-召回指標上也明顯優於其他方法。"
"這些發現突出了DeepFM-Crispr在評估sgRNA效果方面的增強預測準確性,證實了其在基因編輯應用中的潛在價值。"