Core Concepts
自然言語の3つの利点に焦点を当てた、分子設計における重要性
Abstract
L+M-24は、自然言語を使用した分子設計における3つの主要な利点に焦点を当てたデータセットです。このデータセットは、化学ドメインから分子ソリューションが必要であり、AIツールが不可欠であることを強調しています。さまざまなプロパティやカテゴリーに基づいて生成された多くのテンプレートを使用して、分子特性を記述する方法が提案されています。また、異なるモデル間で生成された未知のプロパティ組み合わせに対する結果も示されています。
Stats
L+M-24は合計1512865個のプロパティ-分子ペアを含んでいます。
バイオメディカルグループには776712個のペアが含まれています。
光と電気グループには14077個のペアが含まれています。
農業および産業グループには694619個のペアが含まれています。
Quotes
"Language-molecule models have emerged as an exciting direction for molecular discovery and understanding."
"Improving understanding of these applications can have important implications in problems such as drug discovery, climate issues, more efficient and green industrial processes, and improved food production."