PaddleHelixチームはAlphaFold3の高度な機能を複製することを目的としてHelixFold3を開発している。AlphaFold2、AlphaFold-Multimer、最新のAlphaFold3は、単一のタンパク質鎖、タンパク質複合体、バイオ分子構造の予測において著しい精度向上を遂げてきた。AlphaFold2とAlphaFold-Multimer はオープンソース化されており、迅速かつ信頼性の高い予測を可能にしているが、AlphaFold3は一部のみオンラインサーバーで利用可能で、オープンソース化されていないため、さらなる発展が制限されている。
これらの課題に対処するため、PaddleHelixチームはHelixFold3の開発に取り組んでいる。過去のモデルからの洞察と大規模なデータセットを活用し、HelixFold3は従来のリガンド、核酸、タンパク質の構造予測においてAlphaFold3と同等の精度を達成している。HelixFold3の初期リリースがGitHubでオープンソースとして公開され、バイオ分子研究の進展と新しい発見の加速に貢献することが期待されている。
HelixFold3の性能評価では、リガンドについてはPoseBusters ベンチマークを使用し、精度と物理的妥当性を評価した。核酸については、CASP15のRNA ターゲットと最近のRNA/DNA構造を使用して評価した。タンパク質については、CASP15のタンパク質ターゲットを使用して精度を評価した。さらに、予測の信頼性を評価するための指標の有効性も分析した。
この包括的な分析により、HelixFold3の予測精度がAlphaFold3に匹敵する水準に達していることが示された。HelixFold3の初期リリースがオープンソースで公開されたことで、研究者がこの基盤を活用し、さらなる研究を行い、HelixFold3を様々な生物学的課題に適用することで、複雑なバイオ分子システムの理解を深め、構造生物学や関連分野の新しい応用の開発を加速することが期待される。
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問