Durch einfache Anpassungen kann der Decoder-basierte LLaMA-Transformer effizient für visuelle Aufgaben eingesetzt werden, ohne die Leistung zu beeinträchtigen.