Centrala begrepp
AirLiftは、以前に1つの参照ゲノムにマッピングされていた読み取りデータセットを迅速、包括的、正確に別の類似する参照ゲノムにリマッピングできる最初のツールである。
Sammanfattning
この論文では、AirLiftという新しい手法とツールを紹介している。AirLiftは、以前に1つの参照ゲノムにマッピングされていた読み取りデータセットを、別の類似する参照ゲノムに迅速、包括的、正確にリマッピングできる。
AirLiftの主な特徴は以下の通り:
- 参照ゲノム間の類似性を活用して、読み取りを効率的にリマッピングする。
- 定数領域、更新領域、退役領域、新規領域の4つのカテゴリーに参照ゲノムの領域を分類する。
- 定数領域と更新領域のルックアップテーブルを構築し、読み取りの元の位置に基づいて、新しい参照ゲノムでの潜在的な位置を迅速に特定する。
- 読み取りの元の位置に基づいて、4つのケースに分けて読み取りをリマッピングする。
- 完全なマッピングと比較して、大幅な実行時間の短縮を実現する(最大27.4倍)。
- SNPとインデルの同定精度が完全なマッピングと同等である。
AirLiftは、参照ゲノムの更新に伴う読み取りデータセットのリマッピングを大幅に高速化し、正確で包括的な結果を提供する初めての手法である。
Statistik
人間のゲノムリファレンスhg38に対して、hg19からのリマッピングでは、SNPの同定精度が97.05%、再現率が96.39%である。
人間のゲノムリファレンスhg38に対して、hg19からのリマッピングでは、インデルの同定精度が85.50%、再現率が89.02%である。