本研究では、PharmacoMatchと呼ばれる新しい対照学習フレームワークを紹介しています。この手法は、3D薬物動態スクリーニングをニューラルサブグラフマッチングの問題として再解釈し、エンコーダーモデルを使ってクエリとターゲットの関係をエンベディング空間に符号化することで、効率的なデータベースクエリを可能にします。
まず、1.2百万件の未ラベルの小分子化合物からなる学習データセットを構築しました。次に、グラフニューラルネットワーク(GNN)エンコーダーモデルを自己教師あり学習で訓練し、3D薬物動態を表す意味のあるベクトル表現を生成しました。この表現は、部分順序損失関数を最適化することで学習されます。
次に、学習したエンコーダーを使ってデータベース薬物動態のベクトル表現を事前に計算し、クエリ薬物動態との部分順序比較によってヒットリストを生成します。この方法は、アラインメントアルゴリズムに比べて大幅に高速です。
実験では、10種類のDUD-E ベンチマークデータセットを使って性能を評価しました。PharmacoMatchは、アラインメントアルゴリズムと同等の仮想スクリーニング性能を示しつつ、2桁の高速化を実現しました。この結果は、PharmacoMatchが大規模データベースのスクリーニングに有効であることを示しています。
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Daniel Rose,... lúc arxiv.org 09-11-2024
https://arxiv.org/pdf/2409.06316.pdfYêu cầu sâu hơn