Core Concepts
AlphaFold2を使用して、タンパク質間相互作用を正確に識別するための機械学習モデルPPIscreenMLを開発した。
Abstract
本研究では、タンパク質間相互作用を効率的に識別するためのPPIscreenMLモデルを開発した。
まず、1,481の実験的に確認されたタンパク質複合体と、それらから生成した1,481の擬似的な非相互作用複合体のデータセットを構築した。これらのデータを用いて、AlphaFold2の出力情報と構造的特徴、Rosetタンパク質スコアを特徴量として、機械学習モデルを訓練した。
その結果、PPIscreenMLは既存の手法であるpDockQやiPTMよりも優れた性能を示し、特に構造的に保存された腫瘍壊死因子スーパーファミリーのリガンド/受容体相互作用を正確に再現できることが分かった。
PPIscreenMLは、AlphaFold2で生成された構造モデルを用いて、タンパク質間相互作用を効率的にスクリーニングできる有用なツールである。今後、このようなツールを活用することで、タンパク質相互作用ネットワークの網羅的な解明が期待できる。
Stats
AlphaFold2モデルの平均PAE値の上位1/4の値
インターフェイス領域の荷電アミノ酸数
インターフェイス領域のLennard-Jones引力スコアの平均
インターフェイス領域のLennard-Jones斥力スコアの平均
インターフェイス領域の溶媒和スコアの平均
インターフェイス領域の静電スコアの平均
インターフェイス領域のβシート構造の割合