toplogo
Log på

生物種特異的で最適なコドン配列を生成するCodonMPNN


Kernekoncepter
CodonMPNNは、タンパク質の立体構造と生物種情報を入力として、高発現のコドン配列を生成することができる。
Resumé

本研究では、タンパク質の立体構造と生物種情報を入力として、高発現のコドン配列を生成するCodonMPNNを提案した。従来のアプローチでは、まずアミノ酸配列を生成し、その後にコドン最適化を行っていたが、CodonMPNNでは立体構造とタクソノミー情報を直接利用してコドン配列を生成することで、より高発現のコドン配列を得ることができる。

実験の結果、CodonMPNNはProteinMPNNと同等の性能を示し、ナイーブなコドン選択手法よりも野生型コドンを高い確率で回復できることが示された。さらに、CodonMPNNは高発現のコドン配列に対して高い尤度を割り当てることができることも確認された。

今後の課題として、構造情報がない場合でもアミノ酸配列からコドン配列を最適化する手法の開発が挙げられる。

edit_icon

Tilpas resumé

edit_icon

Genskriv med AI

edit_icon

Generer citater

translate_icon

Oversæt kilde

visual_icon

Generer mindmap

visit_icon

Besøg kilde

Statistik
同義置換変異の中で発現量に大きな影響を与えるものの70%以上について、CodonMPNNは高発現コドン配列に対して高い尤度を割り当てることができた。
Citater
"CodonMPNNは、タンパク質の立体構造と生物種情報を入力として、高発現のコドン配列を生成することができる。" "実験の結果、CodonMPNNはProteinMPNNと同等の性能を示し、ナイーブなコドン選択手法よりも野生型コドンを高い確率で回復できることが示された。"

Vigtigste indsigter udtrukket fra

by Hannes Stark... kl. arxiv.org 09-27-2024

https://arxiv.org/pdf/2409.17265.pdf
CodonMPNN for Organism Specific and Codon Optimal Inverse Folding

Dybere Forespørgsler

生物種の分類方法を変更した場合、CodonMPNNの性能にどのような影響があるだろうか。

生物種の分類方法を変更することは、CodonMPNNの性能に重要な影響を与える可能性があります。CodonMPNNは、特定の生物種におけるコドン最適化を行うために、分類された生物群の情報を利用しています。もし分類方法が変更され、例えば、より広範な分類群を使用する場合、異なる細胞環境を持つ生物が同じクラスタに含まれることになり、コドンの発現特性が異なるため、生成されるコドン配列の最適性が低下する可能性があります。逆に、より細かい分類を行うことで、特定の生物種に特有のコドン使用パターンをより正確に捉えることができ、CodonMPNNの性能が向上することが期待されます。したがって、分類方法の選択は、CodonMPNNの生成するコドン配列の発現効率に直接的な影響を及ぼす重要な要素です。

アミノ酸配列からコドン配列を最適化する際に、立体構造情報を利用することで、どのような改善が期待できるだろうか。

アミノ酸配列からコドン配列を最適化する際に立体構造情報を利用することで、いくつかの重要な改善が期待できます。まず、立体構造情報は、特定のアミノ酸配列がどのように折りたたまれるかを示すため、コドン配列の選択において、より高い設計可能性(designability)を提供します。CodonMPNNは、立体構造に基づいてコドンを生成するため、生成されるコドン配列は、実際のタンパク質の折りたたみや機能に適したものになる可能性が高まります。さらに、立体構造情報を考慮することで、コドンの発現効率が向上し、最適なコドン使用が促進されるため、最終的にはタンパク質の発現量が増加することが期待されます。このように、立体構造情報を活用することで、コドン配列の最適化がより効果的に行えるようになります。

CodonMPNNで生成したコドン配列を実際に発現させた場合、予測された発現量と実際の発現量の相関はどの程度だろうか。

CodonMPNNで生成したコドン配列を実際に発現させた場合、予測された発現量と実際の発現量の相関は、実験データに基づくと高い相関が期待されます。研究では、CodonMPNNが生成したコドン配列が、より高い発現効率を持つコドン配列に対して高い尤度を予測することが示されています。具体的には、同じタンパク質をコードする異なるコドン配列の中で、より高い発現量を持つものに対して、CodonMPNNが正確に高い尤度を割り当てることができることが確認されています。このように、CodonMPNNの予測は、実際の発現量と良好な相関を持つことが示唆されており、コドン最適化の精度を高めるための有力な手段となるでしょう。
0
star