本研究では、タンパク質の立体構造と生物種情報を入力として、高発現のコドン配列を生成するCodonMPNNを提案した。従来のアプローチでは、まずアミノ酸配列を生成し、その後にコドン最適化を行っていたが、CodonMPNNでは立体構造とタクソノミー情報を直接利用してコドン配列を生成することで、より高発現のコドン配列を得ることができる。
実験の結果、CodonMPNNはProteinMPNNと同等の性能を示し、ナイーブなコドン選択手法よりも野生型コドンを高い確率で回復できることが示された。さらに、CodonMPNNは高発現のコドン配列に対して高い尤度を割り当てることができることも確認された。
今後の課題として、構造情報がない場合でもアミノ酸配列からコドン配列を最適化する手法の開発が挙げられる。
翻譯成其他語言
從原文內容
arxiv.org
深入探究