本研究では、Illumina及びNanoporeシーケンシングデータから結核菌ゲノムを抽出するための計算手法を評価した。
ヒト由来リードの除去では、クラーケンを用いた手法が計算リソースの使用量が少なく、かつ高精度であることが分かった。特に、ヒトパンゲノムリファレンスコンソーシアムのデータベースを用いたクラーケンが、Nanoporeデータとイルミナデータの両方で優れた性能を示した。
結核菌リードの分類では、カスタマイズしたデータベースを用いたminimap2とクラーケンが高い精度を示した。minimap2のMycobacterium属データベースとクラーケンのMycobacterium属データベースが、特に優れた性能を発揮した。
これらのカスタマイズデータベースは、計算リソースの使用量が少なく、ラップトップでの実行が可能であるという利点がある。本研究で開発したデータベースとパイプラインは、オープンソースで公開している。
다른 언어로
소스 콘텐츠 기반
biorxiv.org
핵심 통찰 요약
by Hall,M. B., ... 게시일 www.biorxiv.org 09-19-2023
https://www.biorxiv.org/content/10.1101/2023.09.18.558339v3더 깊은 질문