核心概念
個別化がんワクチンの開発を促進するために、フィードフォワードニューラルネットワークとリカレントニューラルネットワークを組み合わせた新しい機械学習モデル「NEO」が開発され、従来の方法よりも迅速、安価、正確にネオエピトープ結合予測を実現できる可能性が示された。
要約
NEO:個別化がんワクチンのための新規エピトープ最適化モデル
この論文は、個別化がんワクチン開発のための新しい機械学習モデル「NEO」を紹介する研究論文である。
本研究の目的は、がん患者の腫瘍細胞に存在するネオエピトープの中から、免疫応答を誘導する可能性のあるものを、より迅速、安価、正確に予測する計算モデルを開発することである。
本研究では、米国国立がん研究所(NCI)の臨床試験データセットを用いて、2,433,281個のユニークなエピトープのMHC結合親和性を予測するモデルを開発した。
モデルのアーキテクチャは、非連続データから学習するフィードフォワードニューラルネットワーク(FFNN)と、ペプチド配列の連続データから学習するLSTMアーキテクチャを持つリカレントニューラルネットワーク(RNN)の2つのブランチからなるアンサンブルモデルを採用した。
データセットの不均衡を解消するために、SMOTE(Synthetic Minority Over-sampling Technique)を用いて、訓練データセット中の少数派クラス(MHC結合陽性)のサンプル数を増加させた。