Ein vielseitiges Protein-Sprach-LLM mit Protein-als-Wort-Vortraining
PROTLLM ist ein vielseitiges Kreuzmodell-LLM, das sowohl für protein-zentrische als auch für protein-sprachliche Aufgaben geeignet ist. PROTLLM verfügt über einen einzigartigen dynamischen Protein-Montage-Mechanismus, der es ermöglicht, komplexe Eingaben zu verarbeiten, bei denen der natürlichsprachliche Text mit einer beliebigen Anzahl von Proteinen durchsetzt ist. Darüber hinaus schlagen wir den Protein-als-Wort-Sprachmodellierungsansatz vor, um PROTLLM zu trainieren.