Concepts de base
트랜스포머 기반 모델 DiaTrans는 데이터 독립적 획득 질량 분석 데이터로부터 펩타이드 서열을 효과적으로 해독할 수 있다.
Résumé
본 연구에서는 데이터 독립적 획득(DIA) 질량 분석 데이터를 위한 de novo 펩타이드 서열 분석 모델인 DiaTrans를 제안하였다. DiaTrans는 트랜스포머 아키텍처를 기반으로 하며, MS1, MS2 및 전구체 프로파일 정보를 통합하는 새로운 인코더 블록을 포함한다. 세 가지 다른 통합 방법(concatenation, 표준 attention, 다중 헤드 attention)을 평가하였으며, concatenation 방식이 가장 우수한 성능을 보였다.
DiaTrans는 기존 최신 모델인 DeepNovo-DIA와 PepNet에 비해 아미노산 수준 및 펩타이드 수준에서 정확도와 재현율이 크게 향상되었다. 특히 펩타이드 수준 정확도가 59%에서 81.36%까지 향상되었다. 이는 DIA 데이터와 DiaTrans 모델의 통합이 새로운 펩타이드 발견과 생물학적 샘플의 포괄적인 프로파일링에 큰 도움이 될 것임을 시사한다.
Stats
DiaTrans는 DeepNovo-DIA 대비 펩타이드 수준 정확도를 59%에서 81.36%까지 향상시켰다.
DiaTrans는 DeepNovo-DIA 대비 아미노산 수준 정확도를 11.11%에서 63.07%까지 향상시켰다.
DiaTrans는 PepNet 대비 펩타이드 수준 정확도를 91.45%에서 123.99%까지 향상시켰다.
DiaTrans는 PepNet 대비 아미노산 수준 정확도를 53.24%에서 96.04%까지 향상시켰다.
Citations
"DiaTrans는 DeepNovo-DIA와 PepNet 대비 아미노산 및 펩타이드 수준에서 크게 향상된 성능을 보였다."
"DIA 데이터와 DiaTrans 모델의 통합은 새로운 펩타이드 발견과 생물학적 샘플의 포괄적인 프로파일링에 큰 도움이 될 것이다."