核心概念
ウイルームには高速に変異するプロカリオティックおよびユーカリオティックウイルス由来の配列が混在しており、これらの正確な同定と分類は微生物群集の理解に不可欠である。本研究では、トリヌクレオチドペアの相対距離と頻度、および2次元畳み込みニューラルネットワークを組み合わせた新しい手法IPEV を開発し、ウイルームからプロカリオティックおよびユーカリオティックウイルスを識別する。
要約
本研究では、ウイルームからプロカリオティックおよびユーカリオティックウイルスを効率的に識別するための新しい手法IPEVを開発した。
ウイルームには、高速に変異するプロカリオティックおよびユーカリオティックウイルス由来の配列が混在しており、これらの正確な同定と分類は微生物群集の理解に不可欠である。しかし、ウイルスゲノムの高い変異率により、高性能な分類ツールの開発が困難となっている。
IPEVは、トリヌクレオチドペアの相対距離と頻度、および2次元畳み込みニューラルネットワークを組み合わせた新しい手法である。交差検証の結果、IPEVは既存手法と比較して、既知のウイルスとの配列相同性が30%未満の場合、F1スコアを約22%改善した。さらに、実際のウイルームサンプルでも、配列アラインメントを用いた注釈に基づいて、他の手法よりも高い精度を示した。また、IPEVは既存手法と比較して実行時間を50倍短縮できる。
IPEVを用いて縦断的なサンプルを再解析したところ、これまで観察されていた持続的な個人ウイルームよりも、腸内ウイルームの時間的安定性が高いことが明らかになった。これは、腸内ウイルームの強靭性に関する新しい知見を提供するものである。
IPEVは、ウイルームからプロカリオティックおよびユーカリオティックウイルスを高精度に識別できる、ユーザーフレンドリーなツールである。
統計
ウイルームには、およそ1031個のウイルス粒子が含まれている。
既知のウイルス種は10,434種類に過ぎない。
IPEVは、既存手法と比較して実行時間を50倍短縮できる。
引用
"ウイルームには、およそ1031個のウイルス粒子が含まれている。"
"既知のウイルス種は10,434種類に過ぎない。"