本文介紹了一個新的酵素-反應預測基準測試 ReactZyme。ReactZyme 從 SwissProt 和 Rhea 數據庫中收集了大量的酵素-反應對,包含 178,463 個正樣本,178,327 個獨特酵素和 7,726 個獨特反應。與現有的酵素-反應數據集相比,ReactZyme 具有更大的規模和更豐富的資訊。
本文提出了一種新的方法來表示酵素和反應,包括使用分子圖和結構信息來捕捉反應的細微變化,以及利用蛋白質語言模型和等變圖神經網絡來表示酵素。這些表示方法旨在更好地捕捉酵素功能的複雜性。
作者還設計了一個酵素-反應預測的檢索任務,並提出了多種基準模型進行評估。結果顯示,結合分子結構和蛋白質序列信息的模型在不同的數據分割上都取得了較好的性能。
總的來說,ReactZyme 為酵素-反應預測提供了一個全新的基準,並展示了利用機器學習技術分析酵素反應數據的潛力,為生物學研究和工業應用帶來新的機遇。
Na inny język
z treści źródłowej
arxiv.org
Głębsze pytania