LUMOS ist ein offenes, modulares und einheitliches Trainingssystem für Sprachagenten, das aus drei Hauptmodulen besteht: einem Planungsmodul, einem Zuordnungsmodul und einem Ausführungsmodul. Das Planungsmodul lernt, komplexe Aufgaben in eine Sequenz von Teilzielen zu zerlegen. Das Zuordnungsmodul übersetzt diese Teilziele in ausführbare Aktionen, die dann vom Ausführungsmodul umgesetzt werden. LUMOS bietet zwei Formulierungen für das Training und die Inferenz von Agenten: LUMOS-OnePass (LUMOS-O) und LUMOS-Iterative (LUMOS-I). LUMOS-O ist eine effiziente Formulierung, bei der alle Teilziele und Aktionen in einem einzigen Inferenzschritt generiert werden. LUMOS-I ist eine adaptive Formulierung, bei der die Agenten basierend auf den Ausführungsergebnissen flexibel planen können.
Um LUMOS mit hochwertigen Trainingsdaten zu versorgen, nutzen wir starke Sprachmodelle, um Annotationen aus bestehenden Benchmarks in ein einheitliches Format zu überführen. Auf diese Weise konnten wir rund 56.000 Annotationen für das Multi-Aufgaben-Training von Agenten erstellen.
Die Evaluation zeigt, dass LUMOS die Leistung verschiedener Open-Source-Agenten auf einer Reihe komplexer interaktiver Aufgaben wie Frage-Antwort, Webaufgaben, Mathematik und multimodale Aufgaben übertrifft. Darüber hinaus demonstriert LUMOS eine starke Generalisierungsfähigkeit auf ungesehene Aufgaben, indem es sogar größere Agenten übertrifft.
To Another Language
from source content
arxiv.org
Viktige innsikter hentet fra
by Da Yin,Faeze... klokken arxiv.org 03-14-2024
https://arxiv.org/pdf/2311.05657.pdfDypere Spørsmål