핵심 개념
HairSplitter는 어셈블리와 장기 리드를 사용하여 하플로타입을 효율적으로 분리할 수 있는 새로운 소프트웨어이다.
초록
HairSplitter는 장기 노이즈 리드에서 바이러스와 박테리아 하플로타입을 분리하는 새로운 소프트웨어이다. 이 파이프라인은 다음 5단계로 구성된다:
- 어셈블리 보완: 리드가 처음부터 끝까지 정확하게 정렬되도록 어셈블리 그래프를 보완한다.
- 변이 호출: 실제 변이와 정렬 또는 시퀀싱 아티팩트를 구분하기 위해 맞춤형 변이 호출 프로세스를 사용한다.
- 리드 바이닝: 변이 위치에서 리드를 하플로타입별로 클러스터링한다.
- 재어셈블리: 하플로타입별 리드 그룹을 사용하여 새로운 하플로타입 특정 컨티그를 생성한다.
- 그래프 언집: 반복 영역을 분리하여 최종 하플로타입 어셈블리를 생성한다.
HairSplitter는 노이즈가 많은 장기 리드에서도 바이러스와 박테리아 하플로타입을 효과적으로 분리할 수 있다. 특히 낮은 상대 풍부도와 높은 유사성을 가진 하플로타입을 잘 복원한다. 또한 계산 효율성이 높아 다양한 메타게놈 분석에 활용할 수 있다.
통계
하플로타입 분리를 위해 변이 위치에서 5개 이상의 리드가 대체 대립 유전자를 가져야 한다.
10개의 변이 위치에서 10개의 리드가 공유하는 대체 대립 유전자가 있다면, 이는 오류일 확률이 2% 미만이므로 서로 다른 하플로타입으로 간주할 수 있다.
인용구
"HairSplitter는 노이즈가 많은 장기 리드에서도 바이러스와 박테리아 하플로타입을 효과적으로 분리할 수 있다."
"HairSplitter는 특히 낮은 상대 풍부도와 높은 유사성을 가진 하플로타입을 잘 복원한다."