본 연구는 단백질 구조 생성을 위한 새로운 확산 모델 CONFDIFF를 제안한다.
CONFDIFF의 기본 모델은 시퀀스 조건부 모델과 무조건 모델을 결합하여 다양성과 품질의 균형을 달성한다. 시퀀스 조건부 모델은 단백질 서열 정보를 활용하여 구조를 예측하고, 무조건 모델은 일반적인 단백질 구조 분포를 학습한다. 이를 통해 다양한 구조를 생성하면서도 품질을 유지할 수 있다.
이에 더해 CONFDIFF는 물리 기반 에너지 및 힘 가이드를 추가로 적용한다. 에너지 가이드는 중간 에너지 함수를 신경망으로 근사하여 생성된 구조의 에너지를 최소화한다. 힘 가이드는 중간 힘 함수를 직접 추정하여 역확산 과정에 적용함으로써, 볼츠만 분포에 더 부합하는 구조를 생성한다.
실험 결과, CONFDIFF는 다양한 단백질 구조 예측 벤치마크에서 기존 최신 모델들을 능가하는 성능을 보였다. 특히 에너지 및 힘 가이드를 통해 생성된 구조가 더 낮은 에너지 상태를 유지하면서도 다양성을 잘 보존하는 것으로 나타났다.
Para Outro Idioma
do conteúdo original
arxiv.org
Principais Insights Extraídos De
by Yan Wang,Lih... às arxiv.org 03-22-2024
https://arxiv.org/pdf/2403.14088.pdfPerguntas Mais Profundas