Großen Sprachmodellen für Code (d.h. Code-LLMs) mangelt es an der Fähigkeit, das Laufzeitverhalten von Programmen zu verstehen und logisch konsistent zu sein.