本研究では、Illumina及びNanoporeシーケンシングデータから結核菌ゲノムを抽出するための計算手法を評価した。
ヒト由来リードの除去では、クラーケンを用いた手法が計算リソースの使用量が少なく、かつ高精度であることが分かった。特に、ヒトパンゲノムリファレンスコンソーシアムのデータベースを用いたクラーケンが、Nanoporeデータとイルミナデータの両方で優れた性能を示した。
結核菌リードの分類では、カスタマイズしたデータベースを用いたminimap2とクラーケンが高い精度を示した。minimap2のMycobacterium属データベースとクラーケンのMycobacterium属データベースが、特に優れた性能を発揮した。
これらのカスタマイズデータベースは、計算リソースの使用量が少なく、ラップトップでの実行が可能であるという利点がある。本研究で開発したデータベースとパイプラインは、オープンソースで公開している。
他の言語に翻訳
原文コンテンツから
biorxiv.org
抽出されたキーインサイト
by Hall,M. B., ... 場所 www.biorxiv.org 09-19-2023
https://www.biorxiv.org/content/10.1101/2023.09.18.558339v3深掘り質問