toplogo
Logga in

Leap: Molecular Synthesisability Scoring with Intermediates


Centrala begrepp
Leap, a novel synthesisability scoring method, considers intermediates to better estimate the practical synthetic complexity of molecules.
Sammanfattning

1. Abstract:

  • Assessing molecule synthesis is crucial in drug discovery.
  • Existing methods lack dynamic conditioning on intermediates.
  • Leap model surpasses other scoring methods by at least 5% on AUC score.

2. Introduction:

  • Predicting compound synthesizability accelerates drug discovery.
  • Synthesis planning algorithms are computationally expensive.
  • Generative workflows need fast and accurate metrics for chemical tractability.

3. Methods:

  • Leap uses transformers to predict multi-step synthesis routes.
  • Pre-training involves encoding synthesis routes as strings.
  • Fine-tuning predicts tree depth for target molecules with or without intermediates.

4. Experiments:

  • Leap outperforms other scorers in identifying synthesisable molecules.
  • Leap adapts its scores when key intermediates are provided.
  • Leap maintains ranking of expected tree depth with different intermediates.

5. Conclusion:

  • Leap is the first method to consider intermediates in scoring molecule synthesisability.
  • Pre-training enhances Leap's performance compared to baseline models like CatBoost and BERT.
edit_icon

Anpassa sammanfattning

edit_icon

Skriv om med AI

edit_icon

Generera citat

translate_icon

Översätt källa

visual_icon

Generera MindMap

visit_icon

Besök källa

Statistik
SAScore、SCScore、RAScoreなどの既存の合成可能性スコアリング方法が存在します。 Leapは他のスコアリング方法を少なくともAUCスコアで5%上回ります。
Citat

Viktiga insikter från

by Anto... arxiv.org 03-21-2024

https://arxiv.org/pdf/2403.13005.pdf
Leap

Djupare frågor

化学的トラクタビリティに関する高速かつ正確なメトリックが必要な場面では、Leapモデルはどのように役立ちますか

Leapモデルは、化学的トラクタビリティに関する高速かつ正確なメトリックが必要な場面で非常に役立ちます。特に、中間体情報を考慮して合成可能性を評価することができるため、実際の合成プロセスにおいて重要な化合物を迅速かつ効果的に特定し、選別することが可能です。この能力は、薬物探索や有機合成の分野で大きな利点となります。さらに、Leapモデルは他のスコアリング方法よりも優れた性能を発揮し、異種ドメインの新規化合物への汎用性も示しています。

既存のスコアリング方法が中間体情報に適応できない場合、それが化合物の合成複雑さを過大評価する可能性はありますか

既存のスコアリング方法が中間体情報に適応できない場合、化合物の合成複雑さが過大評価される可能性があります。これは主に、「Leap」モデルが中間体情報を動的に取り込むことで生じる問題です。通常のスコアリング手法ではこのような柔軟性や適応力が欠如しており、特定時点で利用可能な中間体情報を考慮しないため、「Leap」モデルほど精度良く化学的トラクタビリティを予測することは困難です。

Leapモデルが異なる中間体を提供する場合でも予想される木の深さのランキングを維持できる理由は何ですか

「Leap」モデルが異なる中間体を提供する場合でも予想される木の深さのランキングを維持できる理由は以下です。 「Leap」モデルは事前訓練されたGPT-2ベースの深層学習ネットワークであり、多段階逆シンセシス経路全体を予測する能力から派生したファインチューニング手法を使用している。 ネットワーク内部では反復処理や注意機構(Attention)等強力かつ柔軟なニューラル言語処理技術(NLP)手法も活用されており、「真偽」「意味」「文脈」といった要素までも考慮した推論・予測能力向上も期待されている。 また、「false intermediates」という誤った仲介分子ペア生成技術等も導入し,不正確あるいは無関連仲介分子対策等も行っており,その結果,信頼性高く安定したランキング予測値出力及び解析結果保持率向上効果も見込まれています。
0
star