本研究では、Illumina及びNanoporeシーケンシングデータから結核菌ゲノムを抽出するための計算手法を評価した。
ヒト由来リードの除去では、クラーケンを用いた手法が計算リソースの使用量が少なく、かつ高精度であることが分かった。特に、ヒトパンゲノムリファレンスコンソーシアムのデータベースを用いたクラーケンが、Nanoporeデータとイルミナデータの両方で優れた性能を示した。
結核菌リードの分類では、カスタマイズしたデータベースを用いたminimap2とクラーケンが高い精度を示した。minimap2のMycobacterium属データベースとクラーケンのMycobacterium属データベースが、特に優れた性能を発揮した。
これらのカスタマイズデータベースは、計算リソースの使用量が少なく、ラップトップでの実行が可能であるという利点がある。本研究で開発したデータベースとパイプラインは、オープンソースで公開している。
翻译成其他语言
从原文生成
biorxiv.org
从中提取的关键见解
by Hall,M. B., ... 在 www.biorxiv.org 09-19-2023
https://www.biorxiv.org/content/10.1101/2023.09.18.558339v3更深入的查询