Core Concepts
本研究では、タンパク質ポケットに複数の小分子を結合させるための新しい深層学習ベースのアプローチ「FLOWSITE」を提案する。FLOWSITE は、タンパク質ポケットの離散的なアミノ酸残基の種類と小分子の3次元結合構造を同時に生成することができる。
Abstract
本研究では、タンパク質ポケットに小分子を結合させるための新しい深層学習ベースのアプローチ「FLOWSITE」を提案している。
まず、HARMONICFLOW と呼ばれる3次元の小分子結合構造を生成するための改良されたジェネレーティブプロセスを開発した。HARMONICFLOW は、自己条件付きのフロー照合目的関数に基づいており、従来のジェネレーティブプロセスよりも単純性、一般性、平均サンプル品質の面で優れている。
次に、FLOWSITE はこの構造モデリングを活用し、ポケットの離散的なアミノ酸残基の種類と小分子の3次元結合構造を同時に生成することができる。FLOWSITE は、既存の手法よりも大幅に良好なバインディングサイトを設計することができる。
具体的には、まず初期の残基の種類と小分子の位置を調和プライオアから抽出する。その後、学習されたベクトル場に従って繰り返し更新することで、最終的な結合ポケットを生成する。この際、離散的な残基の種類と連続的な小分子の位置を同時に更新する。
さらに、「偽リガンド」データ拡張手法を導入することで、設計されたポケットの性能をさらに向上させている。
全体として、FLOWSITE は小分子結合ポケットの設計に対する初の深層学習ソリューションであり、離散変数と連続変数の同時生成を可能にする汎用的なフレームワークとなっている。
Stats
タンパク質ポケットの残基と小分子の重原子間距離が4Å以内の場合、その残基を接触残基とみなす。
接触残基のうち、生成された残基の種類が正解と一致したものの割合は47.0%である。
オラクル手法(正解の3次元構造を利用)の場合、接触残基の回復率は51.4%である。