本研究では、Illumina及びNanoporeシーケンシングデータから結核菌ゲノムを抽出するための計算手法を評価した。
ヒト由来リードの除去では、クラーケンを用いた手法が計算リソースの使用量が少なく、かつ高精度であることが分かった。特に、ヒトパンゲノムリファレンスコンソーシアムのデータベースを用いたクラーケンが、Nanoporeデータとイルミナデータの両方で優れた性能を示した。
結核菌リードの分類では、カスタマイズしたデータベースを用いたminimap2とクラーケンが高い精度を示した。minimap2のMycobacterium属データベースとクラーケンのMycobacterium属データベースが、特に優れた性能を発揮した。
これらのカスタマイズデータベースは、計算リソースの使用量が少なく、ラップトップでの実行が可能であるという利点がある。本研究で開発したデータベースとパイプラインは、オープンソースで公開している。
In un'altra lingua
dal contenuto originale
biorxiv.org
Approfondimenti chiave tratti da
by Hall,M. B., ... alle www.biorxiv.org 09-19-2023
https://www.biorxiv.org/content/10.1101/2023.09.18.558339v3Domande più approfondite