แนวคิดหลัก
바이두 PaddleHelix팀은 AlphaFold3의 기능을 복제하기 위해 HelixFold3를 개발하고 있으며, 소형 분자 리간드, 핵산, 단백질 구조 예측 정확도가 AlphaFold3와 유사한 수준에 도달했다.
บทคัดย่อ
바이두 PaddleHelix팀은 AlphaFold3의 기능을 복제하기 위해 HelixFold3를 개발하고 있다. HelixFold3는 이전 모델들의 통찰력을 활용하고 광범위한 데이터셋을 활용하여 AlphaFold3와 유사한 수준의 정확도를 달성했다.
HelixFold3의 성능 평가:
- 리간드: PoseBusters 벤치마크에서 AlphaFold3와 유사한 수준의 정확도를 보였다.
- 핵산: CASP15 RNA 타겟과 PDB의 최신 RNA/DNA 구조에서 AlphaFold3와 유사한 수준의 정확도를 보였다.
- 단백질: 단백질-단백질 복합체 예측에서 AlphaFold-Multimer를 능가했지만 AlphaFold3와는 아직 격차가 있다.
HelixFold3는 예측 신뢰도 지표(pLDDT, pAE, pTM)를 활용하여 예측 정확도를 평가할 수 있다. 이 지표들은 실제 정확도와 강한 상관관계를 보였다.
HelixFold3의 초기 버전이 오픈소스로 공개되어 연구자들이 활용할 수 있게 되었다. 향후 더 큰 데이터셋과 다양한 생체분자에 대한 성능 향상을 위해 지속적으로 개선될 예정이다.
สถิติ
리간드 예측 정확도 비교:
HelixFold3는 AlphaFold3와 유사한 수준의 RMSD<2Å 성공률을 보였다.
이는 실험적 구조 정보가 없는 경우에도 높은 정확도를 달성했다.
핵산 예측 정확도 비교:
CASP15 RNA 타겟에서 HelixFold3는 AlphaFold3와 유사한 수준의 RNA LDDT를 보였다.
PDB의 최신 RNA/DNA 구조에서 HelixFold3는 RoseTTAFold2NA, RoseTTAFold-AllAtom보다 월등히 높은 LDDT를 보였다.
단백질 복합체 예측 정확도 비교:
HelixFold3는 AlphaFold-Multimer보다 단백질-단백질 복합체 계면 예측 정확도가 높았다.
그러나 AlphaFold3와는 아직 격차가 있다.