Core Concepts
생물학적 경로 토큰화와 메모리 효율적인 다중 모달 Transformer를 통해 조직학 및 전사체 데이터의 상호작용을 모델링하여 환자 생존 예측 성능을 향상시킬 수 있다.
Abstract
이 연구는 환자 생존 예측을 위해 조직학 전체 슬라이드 이미지(WSI)와 벌크 전사체 데이터를 통합하는 방법을 제안한다.
주요 내용은 다음과 같다:
전사체 데이터를 의미 있고 해석 가능한 생물학적 경로 토큰으로 인코딩하는 방법을 제안한다. 이를 통해 전사체 데이터를 조직학 패치 토큰과 의미 있게 융합할 수 있다.
메모리 효율적인 다중 모달 Transformer 아키텍처를 제안하여 경로와 패치 토큰 간의 상호작용을 모델링한다. 이는 기존 방법의 확장성 문제를 해결한다.
다수준 해석 가능성 프레임워크를 제안하여 전사체, 조직학, 그리고 두 모달리티 간 상호작용에 대한 통찰을 제공한다.
5개의 TCGA 데이터셋에서 제안 모델의 우수한 생존 예측 성능을 입증한다.
이 연구는 다중 모달 데이터 융합을 통해 환자 예후 예측 정확도를 높이고, 유전형과 표현형 간 상호작용에 대한 통찰을 제공할 수 있다.
Stats
전사체 데이터는 총 60,499개의 유전자로 구성되어 있다.
331개의 생물학적 경로 토큰이 사용되었다.
총 2,233개의 진단 WSI와 약 32.4백만 개의 패치가 수집되었다.
Quotes
"전사체 데이터를 의미 있고 해석 가능한 생물학적 경로 토큰으로 인코딩하는 것이 중요하다."
"메모리 효율적인 다중 모달 Transformer 아키텍처를 통해 경로와 패치 토큰 간의 상호작용을 모델링할 수 있다."
"다수준 해석 가능성 프레임워크를 통해 전사체, 조직학, 그리고 두 모달리티 간 상호작용에 대한 통찰을 제공할 수 있다."