RNA 생성을 위한 잠재 확산 모델
본 논문은 RNA 서열을 생성하고 최적화하기 위한 잠재 확산 모델 RNAdiffusion을 제안한다. 이 모델은 사전 학습된 BERT 기반 모델을 사용하여 원시 RNA를 생물학적으로 의미 있는 표현으로 인코딩하고, Q-Former를 통해 이를 고정 길이 잠재 벡터로 압축한다. 이후 이 잠재 공간에서 확산 모델을 학습하여 RNA 서열을 생성한다. 또한 보상 네트워크를 학습하여 잠재 공간에서 RNA의 기능적 특성을 예측하고, 이를 활용해 확산 과정을 유도하여 단백질 생산 효율이 높은 5'-UTR 서열을 생성한다.