本研究では、GRAMEP (Genome vaRiation Analysis from the Maximum Entropy)と呼ばれる新しい手法を提案している。GRAMEP は、最大エントロピー原理に基づいて、ゲノム中の最も情報量の高い領域を特定する。
まず、解析対象のゲノムバリアントごとに、出現頻度の高いk-merを抽出する。次に、最大エントロピー原理を用いて、各バリアントに特徴的なk-merを選定する。これらの特徴的k-merを用いて、変異の同定と系統分類を行うことができる。
GRAMEP は、in silico シミュレーションと実際のウイルスゲノムデータを用いた評価で、高い精度と効率性を示した。特に、SARS-CoV-2のバリアント同定では、既存の手法と比較して計算コストが低く、変異の同定も正確に行えることが確認された。
さらに、GRAMEP は変異の共通性解析や系統樹の構築、新規配列の分類にも活用できる。これらの機能を備えた、オープンソースのプルーフオブコンセプト実装が公開されている。
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by Math... kl. arxiv.org 05-06-2024
https://arxiv.org/pdf/2405.01715.pdfDybere Forespørgsler