Core Concepts
構造情報を組み込んだ簡単で効率的なアダプター手法により、タンパク質言語モデルの表現学習を強化する。
Abstract
本研究では、タンパク質言語モデル(PLM)の表現学習を強化するために、SES-Adapterと呼ばれる簡単で効率的かつスケーラブルなアダプター手法を提案した。SES-Adapterは、PLMの埋め込みに構造情報を組み込むことで、構造対応の表現を生成する。
具体的には以下の通り:
PLMの出力埋め込みと、FoldSeekおよびDSSPを用いて生成した構造情報埋め込みを、クロスモーダルな注意機構を用いて融合する。
9種類のPLMアーキテクチャと9種類のベンチマークデータセットを用いて評価を行った。
構造情報を組み込むことで、バニラのPLMと比較して最大11%、平均3%の性能向上を達成した。また、学習速度は最大1034%、平均362%の高速化を実現した。
予測構造の品質が低い場合でも、本手法は頑健に機能することを確認した。
SES-Adapterは、PLMの表現学習を効率的に強化する簡単で汎用性の高い手法であり、様々なタンパク質関連タスクへの適用が期待できる。
Stats
構造情報を組み込むことで、バニラのPLMと比較して最大11%、平均3%の性能向上を達成した。
学習速度は最大1034%、平均362%の高速化を実現した。
予測構造の品質が低い場合でも、本手法は頑健に機能することを確認した。
Quotes
"構造情報を組み込むことで、バニラのPLMと比較して最大11%、平均3%の性能向上を達成した。"
"学習速度は最大1034%、平均362%の高速化を実現した。"
"予測構造の品質が低い場合でも、本手法は頑健に機能することを確認した。"