Core Concepts
다중 튜브 DNA 저장 시스템에서 프라이머-페이로드 충돌로 인한 용량 감소를 해결하기 위해 데이터 청크를 충돌 특성에 따라 다른 튜브에 할당하는 기법을 제안한다.
Abstract
이 논문은 다중 튜브 DNA 저장 시스템에서 프라이머-페이로드 충돌이 전체 저장 용량에 미치는 영향을 분석하고, 이를 해결하기 위한 충돌 인식 데이터 할당 기법을 제안한다.
초기 클러스터링 단계에서는 데이터 청크들의 충돌 프라이머 집합 크기를 최소화하는 방향으로 청크들을 클러스터링한다. 이후 정제 단계에서는 각 클러스터의 크기를 해당 튜브 용량에 맞게 조정한다. 이를 통해 특정 프라이머가 한 튜브에서만 사용 불가능해지도록 하여 전체 저장 용량을 향상시킬 수 있다.
제안 기법은 기존 인코딩 기법 대비 20-25%의 전체 저장 용량 향상을 보였다. 또한 데이터 청크 크기에 따른 트레이드오프를 분석하여 4KB 청크 크기가 적절함을 확인하였다.
Stats
회전 코드 인코딩 기법 적용 시, 순차 할당 대비 평균 사용 가능 프라이머 수가 8,136개에서 10,131개로 증가
회전 코드 인코딩 기법 적용 시, 순차 할당 대비 평균 튜브 용량이 217GB에서 270.94GB로 증가
CAC 인코딩 기법 적용 시, 순차 할당 대비 평균 사용 가능 프라이머 수가 17,550개에서 20,948개로 증가
CAC 인코딩 기법 적용 시, 순차 할당 대비 평균 튜브 용량이 289GB에서 345.42GB로 증가
Quotes
"DNA 저장은 오늘날 빅데이터 문제를 해결할 수 있는 유망한 아카이브 데이터 저장 솔루션이다."
"프라이머-페이로드 충돌은 단일 튜브 용량뿐만 아니라 다중 튜브 용량에도 큰 영향을 미친다."