核心概念
合成可能な化合物を生成するために、化学反応と市販の原料を使用するアクションスペースを持つGFlowNetモデルを提案する。
摘要
本研究では、合成可能な化合物を生成するためのGFlowNetモデルであるSynFlowNetを提案している。従来の分子断片ベースのGFlowNetと比較して、SynFlowNetは以下の特徴を持つ:
- アクションスペースを化学反応と市販の原料に定義することで、生成された化合物の合成可能性が保証される。
- 合成経路を考慮しつつ、目的の分子特性を最適化することができる。
- 断片ベースのGFlowNetと同等の分子多様性を維持しつつ、合成容易性の指標であるSAスコアやQEDスコアが大幅に改善される。
- 実験的に検証された活性化合物と比較しても、分子量、SAスコア、予測タンパク質結合親和性などの特性が同等の高品質な化合物を生成できる。
- 後処理の逆合成解析ツールによって、SynFlowNetで生成された化合物の合成経路が高い確率で見つかることが示された。一方、断片ベースのGFlowNetで生成された化合物の合成経路は見つからない。
以上より、SynFlowNetは合成可能な高品質な化合物を効率的に生成できる有用なツールであると言える。
统计
生成された化合物の平均分子量は419.2
生成された化合物の平均SAスコアは3.4
生成された化合物の平均SCスコアは3.8
生成された化合物の平均リガンド効率は0.05
引用
"合成可能な化学空間から組み合わせられる数十億もの化合物ライブラリーをスクリーニングするのは非現実的である。"
"合成可能性を考慮しない従来の分子生成モデルは、実験的に合成できない化合物を生成してしまう問題がある。"