核心概念
代謝ネットワークの構造的特徴を学習することで、実験データに依存せずに欠落反応を自動的に予測することができる。
要約
本研究では、深層学習を用いた新しい代謝ネットワーク再構築フレームワークCLOSEgapsを提案した。CLOSEgapsは、代謝ネットワークをハイパーグラフとして表現し、ハイパーリンク予測問題としてモデル化することで、既知の反応経路に依存せずに欠落反応を予測することができる。
CLOSEgapsの性能評価では、人工的に欠落を導入した代謝ネットワークに対して96%以上の高い回復率を示した。また、24種の細菌の代謝ネットワークに適用し、発酵産物の予測精度を大幅に向上させることができた。特に、Faecalibacterium prausnitziiでのエタノールとプロピオン酸の生産性、Bifidobacterium longumでのコハク酸とラクテートの生産性が改善された。
さらに、CLOSEgapsは代謝ネットワーク内の代謝物間の関係性を可視化することができ、代謝経路の理解を深めることができる。
以上より、CLOSEgapsは代謝ネットワークの自動再構築と代謝工学への応用において有用な手法であることが示された。
統計
代謝ネットワークの最大成長率が0.01 h-1未満の場合、その遺伝子は必須遺伝子と見なされる。
Escherichia coliの必須遺伝子予測精度はCLOSEgapsが92.04%、CarveMe が84.55%、CHESHIREが91.56%であった。
Faecalibacterium prausnitzii A2-165では、CLOSEgapsによる補完により、エタノール生産が6.03 (mmol/gDCW/h)、プロピオン酸生産が9.95 (mmol/gDCW/h)に改善された。
Bifidobacterium longum subsp. infantis ATCC 15697では、コハク酸生産が5.43 (mmol/gDCW/h)、乳酸生産が4.03 (mmol/gDCW/h)に改善された。
引用
"代謝ネットワークの包括的な理解は、バイオエンジニアリング、薬物ターゲティング、医療療法の進歩に不可欠である。"
"代謝ネットワークの再構築において、効果的かつ堅牢なギャップ補完アルゴリズムが不可欠である。"
"CLOSEgapsは、実験データに依存せずに、代謝ネットワークの構造的特徴を学習することで、欠落反応を自動的に予測することができる。"