Entwicklung von CLLMs zur Verbesserung der Effizienz bei der Inferenz großer Sprachmodelle durch konsistente Vorhersagen.