핵심 개념
大規模な多オミックスバイオシーケンストランスフォーマーモデルは、ラベル付けされていないバイオシーケンスデータから自然発生的に中心ドグマに整合した表現を学習し、ペプチド-ヌクレオチド相互作用の予測において最先端の性能を達成する。
초록
本研究では、ペプチドとヌクレオチドの両方の配列を同時にモデル化する初の多オミックスバイオシーケンストランスフォーマーモデル(OmniBioTE)を開発した。
OmniBioTEは以下の点で優れている:
-
単一オミックスモデルとは異なり、ペプチドとヌクレオチドの配列間の複雑な関係を学習できる。中心ドグマに整合した表現を自然発生的に学習する。
-
ペプチド-ヌクレオチド相互作用の結合自由エネルギー(∆G)と変異の影響(∆∆G)を高精度に予測できる。
-
配列情報のみから、ペプチド-ヌクレオチン結合に重要な残基を特定できる。構造情報を必要としない。
-
単一オミックスモデルと比べて、多オミックスデータを使用しても性能が劣化しない。
本研究は、バイオインフォマティクスにおける多オミックスモデリングの可能性を示し、ペプチド-ヌクレオチド相互作用の理解と予測に大きな進展をもたらすことが期待される。
통계
ペプチド-ヌクレオチド複合体の結合自由エネルギー(∆G)は、OmniBioTEの予測値と実験値の相関係数が0.9を超える。
ペプチド-ヌクレオチド複合体の結合自由エネルギー変化(∆∆G)の予測精度も同様に高い。
OmniBioTEは、ペプチド-ヌクレオチド結合に重要な残基を配列情報のみから高精度に特定できる。
인용구
"大規模な多オミックスバイオシーケンストランスフォーマーモデルは、ラベル付けされていないバイオシーケンスデータから自然発生的に中心ドグマに整合した表現を学習する。"
"OmniBioTEは、ペプチド-ヌクレオチド相互作用の結合自由エネルギーと変異の影響を高精度に予測できる。"
"OmniBioTEは、配列情報のみから、ペプチド-ヌクレオチン結合に重要な残基を特定できる。構造情報を必要としない。"