Core Concepts
한국인 4,157명의 전체 유전체 서열과 107개의 표현형 데이터를 통합한 한국인 유전체-표현형 데이터베이스 구축
Abstract
이 연구는 한국인 4,157명의 전체 유전체 서열과 107개의 표현형 데이터를 통합한 한국인 유전체-표현형 데이터베이스 구축을 보고합니다.
주요 내용은 다음과 같습니다:
한국인 4,157명의 전체 유전체 서열 데이터를 생성하였으며, 이는 45,537,252개의 변이를 포함하고 있습니다. 이는 이전에 보고된 한국인 1,094명의 유전체 데이터(Korea1K)보다 크게 확장된 것입니다.
2,685명의 참여자로부터 107개의 임상 표현형 데이터를 수집하였습니다. 이는 한국인의 유전체-표현형 연관 분석에 활용될 수 있습니다.
유전체-표현형 연관 분석을 통해 1,356개의 새로운 유전형-표현형 연관을 발견하였습니다. 이는 이전 Korea1K 데이터에서 발견되지 않았던 것입니다.
유전체 상관관계, 다형질성, 멘델 무작위화 분석을 수행하여 한국인의 유전체-표현형 관계를 심층적으로 분석하였습니다.
한국인 유전체 데이터를 활용한 유전형 임퓨테이션 성능이 이전 Korea1K 데이터보다 향상되었습니다.
이 연구는 한국인의 유전체 및 표현형 데이터를 통합한 가장 포괄적인 데이터베이스를 제공하며, 이를 활용하여 한국인 특이적인 유전체-표현형 연관 발견에 기여할 것으로 기대됩니다.
Stats
한국인 4,157명의 전체 유전체 서열에서 총 45,537,252개의 변이가 발견되었습니다.
이 중 23,689,147개의 변이는 이전 Korea1K 데이터에서 발견되지 않은 새로운 변이였습니다.
2,324개의 변이가 34개의 임상 표현형과 유의미한 연관을 보였습니다.
24개의 유전적 상관관계, 1,131개의 다형질성 변이, 127개의 인과 관계가 발견되었습니다.
Quotes
"한국인 4,157명의 전체 유전체 서열과 107개의 임상 표현형 데이터를 통합한 데이터베이스를 구축하였습니다."
"이 데이터를 활용하여 1,356개의 새로운 유전형-표현형 연관을 발견하였습니다."
"유전체 상관관계, 다형질성, 멘델 무작위화 분석을 통해 한국인의 유전체-표현형 관계를 심층적으로 분석하였습니다."