본 연구는 단백질 구조 생성을 위한 새로운 확산 모델 CONFDIFF를 제안한다.
CONFDIFF의 기본 모델은 시퀀스 조건부 모델과 무조건 모델을 결합하여 다양성과 품질의 균형을 달성한다. 시퀀스 조건부 모델은 단백질 서열 정보를 활용하여 구조를 예측하고, 무조건 모델은 일반적인 단백질 구조 분포를 학습한다. 이를 통해 다양한 구조를 생성할 수 있다.
이에 더해 CONFDIFF는 물리 기반 에너지 및 힘 가이드를 도입한다. 에너지 가이드는 중간 에너지 함수를 근사하여 생성된 구조의 에너지를 낮추고, 힘 가이드는 중간 힘 함수를 직접 추정하여 역확산 과정에 반영한다. 이를 통해 볼츠만 분포에 더 부합하는 구조를 생성할 수 있다.
실험 결과, CONFDIFF는 기존 최신 방법들에 비해 우수한 성능을 보였다. 특히 에너지 및 힘 가이드를 통해 낮은 에너지의 다양한 구조를 생성할 수 있었다.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Yan Wang,Lih... at arxiv.org 03-22-2024
https://arxiv.org/pdf/2403.14088.pdfDeeper Inquiries