이 논문은 단백질 설계를 위한 심층 학습 기반 방법론을 소개한다. 단백질은 아미노산 서열에 의해 결정되는 3차원 구조를 가지며, 이 서열과 구조가 함께 단백질의 기능을 결정한다.
기존의 단백질 설계 방법은 물리 기반 접근법과 단일 모달리티 기반 심층 학습 접근법으로 나뉜다. 물리 기반 방법은 경험적 에너지 함수의 한계와 기존 구조에 의존적이라는 단점이 있다. 반면 심층 학습 기반 방법은 서열 또는 구조 데이터만을 이용하여 새로운 단백질을 생성할 수 있지만, 서열과 구조 간의 상호작용을 모델링하지 못한다는 한계가 있다.
이 논문에서는 서열과 구조를 동시에 모델링하고 생성하는 심층 학습 기반 "공동 생성(co-generation)" 방법론을 소개한다. 이를 위해 구조를 이산적인 토큰으로 표현하거나, 구조 예측 모델을 활용하거나, 이산적 서열과 연속적 구조를 혼합하는 등의 접근법이 제안되었다. 또한 모든 원자를 직접 생성하는 "전체 원자 공동 생성" 방법도 소개되었다.
이러한 공동 생성 방법은 서열과 구조 간의 상호작용을 더 잘 모델링할 수 있어, 기존 방법보다 더 정확하고 제어 가능한 단백질 설계가 가능할 것으로 기대된다. 또한 다양한 응용 분야, 예를 들어 효소 설계, 치료용 단백질 설계 등에 활용될 수 있을 것이다.
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문