이 논문은 단백질 기능 설계를 위한 새로운 주석 기반 접근법을 제안한다. 기존 연구는 주로 구조적 또는 진화적 정보를 활용하여 단백질을 생성했지만, 이는 단백질의 기능과 속성을 간접적으로만 반영할 수 있다. 이 논문에서는 단백질 데이터베이스에서 추출한 텍스트 주석을 활용하여 단백질 서열을 직접적으로 제어할 수 있는 Protein-Annotation Alignment Generation (PAAG) 프레임워크를 제안한다.
PAAG는 다중 수준 정렬 모듈을 통해 단백질 서열과 주석 표현을 정렬하고, 이를 활용하여 특정 도메인을 포함하는 단백질을 생성할 수 있다. 또한 PAAG는 주석의 조합을 활용하여 다양한 기능의 단백질을 생성할 수 있다.
실험 결과, PAAG는 7개의 예측 작업에서 기존 최신 모델을 능가하는 성능을 보였다. 또한 아연 손가락 도메인과 면역글로불린 도메인 생성 작업에서 PAAG는 기존 모델 대비 약 3배 이상 높은 성공률을 달성했다. 이를 통해 PAAG가 텍스트 주석을 활용하여 단백질 기능을 효과적으로 제어할 수 있음을 보여준다.
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Chaohao Yuan... alle arxiv.org 04-29-2024
https://arxiv.org/pdf/2404.16866.pdfDomande più approfondite