Core Concepts
심층 학습 기반 IPEV 방법은 바이롬 내 원핵생물 및 진핵생물 바이러스 유래 서열을 정확하게 식별할 수 있다.
Abstract
이 연구에서는 IPEV라는 새로운 방법을 소개한다. IPEV는 3핵산쌍의 상대적 거리와 빈도를 활용하여 2D 합성곱 신경망 모델을 통해 바이롬 내 원핵생물 및 진핵생물 바이러스 유래 서열을 구분한다.
교차 검증 평가에서 IPEV는 기존 방법보다 F1 점수를 약 22% 향상시켰다. 특히 알려진 바이러스와 30% 미만의 서열 유사성을 가진 새로운 바이러스를 식별하는 데 뛰어난 성능을 보였다. 또한 IPEV는 기존 방법보다 50배 빠른 실행 속도를 보였다.
IPEV를 이용해 종단적 장내 바이롬 데이터를 재분석한 결과, 개인 지속 바이롬에서 관찰된 것보다 장내 바이롬의 시간적 안정성이 더 높다는 새로운 통찰을 얻었다.
Stats
바이러스 유래 서열 중 원핵생물 바이러스는 5,051개, 진핵생물 바이러스는 11,022개로 구성되었다.
독립 테스트 세트 A에는 원핵생물 바이러스 서열 3,180-3,171개, 진핵생물 바이러스 서열 1,106-1,036개가 포함되었다.
IPEV는 기존 방법 대비 F1 점수를 약 22% 향상시켰다.
IPEV는 기존 방법보다 50배 빠른 실행 속도를 보였다.
Quotes
"IPEV는 바이롬 내 원핵생물 및 진핵생물 바이러스 유래 서열을 정확하게 식별할 수 있는 고성능, 사용자 친화적 도구이다."
"IPEV를 이용한 재분석 결과, 장내 바이롬이 개인 지속 바이롬에서 관찰된 것보다 더 높은 시간적 안정성을 보인다는 새로운 통찰을 얻었다."