核心概念
UK Biobank のエクソームデータから遺伝子と表現型の関連性を効率的に調査できるRパッケージ、ukbFGSEAを開発し、その有効性を検証した。
要約
ukbFGSEA: UK Biobankエクソームデータに高速事前順位付け遺伝子セット濃縮解析を適用するためのRパッケージ
本研究では、UK Biobankの大規模エクソームデータセット「Genebass」に対して、遺伝子セット濃縮解析(GSEA)を実施するための効率的な方法を開発することを目的とした。
Genebassデータセットから遺伝子レベルの関連解析結果を取得し、Rで処理しやすい形式に変換した。
高速事前順位付け遺伝子セット濃縮解析(FGSEA)を用いて、特定の遺伝子セットと表現型の関連性を評価するRパッケージ「ukbFGSEA」を開発した。
ukbFGSEAは、遺伝子セットの順位付けに2つの指標(Betaランキング、Signランキング)を使用し、結果を解釈しやすい濃縮プロットと数値データで出力する。
ukbFGSEAの有効性を検証するため、自閉スペクトラム症(ASD)、発達障害(DD)、神経発達障害(NDD)に関連する3つの遺伝子セットを用いて、Genebassデータセットの分析を行った。