核心概念
Korea4Kデータセットは、4,157人の韓国人全ゲノムシーケンスと107の健康診断パラメータを提供し、韓国人ゲノムと表現型の関連を明らかにする大規模なリソースである。
要約
Korea4Kデータセットは、4,157人の韓国人全ゲノムシーケンスと107の健康診断パラメータを含む大規模なリソースです。
- 45,537,252の変異を同定し、韓国人の大部分の共通および希少変異をカバーしています。
- 1,356の新しいゲノム-表現型の関連を発見しました。これは先行研究のKorea1Kデータセットでは見つからなかったものです。
- 表現型解析により、24の遺伝的相関、1,131の多重形質変異、127の因果関係を明らかにしました。
- Korea4Kインピュテーションリファレンスパネルは、Korea1Kよりも優れたインピュテーション性能を示しました。
- Korea4Kは、韓国人における臨床的に関連する新しいゲノム-表現型の関連を発見するための最も包括的なゲノムおよび表現型データリソースを提供します。
統計
45,537,252の変異が同定された
3,092個体で希少変異(0.1%以下)が、3,569個体で極めて希少変異(0.1%未満)が検出された
481個体で共通変異(1-5%)、161個体で高頻度変異(5%超)が検出された
引用
"Korea4Kは、韓国人における臨床的に関連する新しいゲノム-表現型の関連を発見するための最も包括的なゲノムおよび表現型データリソースを提供します。"
"Korea4Kインピュテーションリファレンスパネルは、Korea1Kよりも優れたインピュテーション性能を示しました。"