본 연구에서는 데이터 독립적 획득(DIA) 질량 분석 데이터를 위한 de novo 펩타이드 서열 분석 모델인 DiaTrans를 제안하였다. DiaTrans는 트랜스포머 아키텍처를 기반으로 하며, MS1, MS2 및 전구체 프로파일 정보를 통합하는 새로운 인코더 블록을 포함한다. 세 가지 다른 통합 방법(concatenation, 표준 attention, 다중 헤드 attention)을 평가하였으며, concatenation 방식이 가장 우수한 성능을 보였다.
DiaTrans는 기존 최신 모델인 DeepNovo-DIA와 PepNet에 비해 아미노산 수준 및 펩타이드 수준에서 정확도와 재현율이 크게 향상되었다. 특히 펩타이드 수준 정확도가 59%에서 81.36%까지 향상되었다. 이는 DIA 데이터와 DiaTrans 모델의 통합이 새로운 펩타이드 발견과 생물학적 샘플의 포괄적인 프로파일링에 큰 도움이 될 것임을 시사한다.
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Shiva Ebrahi... alle arxiv.org 04-10-2024
https://arxiv.org/pdf/2402.11363.pdfDomande più approfondite