Core Concepts
단백질 결합 부위를 설계하기 위해 FLOWSITE는 단백질 백본 구조와 리간드의 화학 그래프를 입력으로 받아 결합 부위의 아미노산 잔기 유형과 리간드의 3D 결합 구조를 동시에 생성한다.
Abstract
이 연구에서는 FLOWSITE라는 새로운 프레임워크를 제안한다. FLOWSITE는 단백질 결합 부위 설계를 위해 단백질 백본 구조와 리간드의 화학 그래프를 입력으로 받는다. 이를 바탕으로 결합 부위의 아미노산 잔기 유형과 리간드의 3D 결합 구조를 동시에 생성한다.
FLOWSITE의 핵심 구성요소는 다음과 같다:
- HARMONICFLOW: 리간드의 3D 결합 구조를 생성하는 개선된 생성 프로세스. 자기 조건부 흐름 매칭 목적함수를 사용하여 단순성, 일반성, 평균 샘플 품질 면에서 기존 방법을 능가한다.
- 이산 및 연속 변수 동시 생성: FLOWSITE는 HARMONICFLOW를 확장하여 이산 아미노산 잔기 유형과 연속 리간드 구조를 동시에 생성한다.
- 가짜 리간드 데이터 증강: 단백질 사이드체인-사이드체인 상호작용이 사이드체인-리간드 상호작용과 유사하다는 증거를 활용하여 성능을 향상시킨다.
실험 결과, FLOWSITE는 기존 접근법에 비해 결합 부위 아미노산 회복률을 47.0%까지 향상시켰다. 이는 리간드의 3D 구조를 알고 있는 오라클 방법(51.4%)과 거의 근접한 수준이다. 이를 통해 FLOWSITE가 리간드 구조에 대한 사전 지식 없이도 효과적으로 결합 부위를 설계할 수 있음을 보여준다.
Stats
단백질 결합 부위 회복률은 FLOWSITE가 47.0%로 기존 방법(39.4%)보다 높다.
BLOSUM 점수로 평가했을 때 FLOWSITE의 점수는 44.3으로 기존 방법(35.2)보다 높다.
Quotes
"FLOWSITE는 리간드 구조에 대한 사전 지식 없이도 효과적으로 결합 부위를 설계할 수 있다."
"HARMONICFLOW는 단순성, 일반성, 평균 샘플 품질 면에서 기존 방법을 능가한다."