本論文では、タンパク質設計の問題に取り組むため、SE(3)上の分布を生成するための FOLDFLOW モデルを提案している。
FOLDFLOW-BASE は、SE(3)上の決定論的な連続時間ダイナミクスを学習し、不変目標分布をマッチングする。FOLDFLOW-OT は、リーマン最適輸送を組み込むことで、より単純で安定なフローを構築する。FOLDFLOW-SFM は、リーマン最適輸送と シミュレーションフリーの学習を組み合わせ、SE(3)上の確率的連続時間ダイナミクスを学習する。
これらの FOLDFLOW モデルは、従来のアプローチと比較して、より安定で高速な学習が可能であり、任意の不変源分布を任意の不変目標分布にマッピングできる。
実験的に、最大 300 アミノ酸のタンパク質バックボーンの生成を検証し、高品質で設計可能、多様、かつ新規なサンプルを生成できることを示した。さらに、FOLDFLOW は、事前学習されたタンパク質構造からの平衡コンフォメーション生成にも有効であることを示した。
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問