LUMOS ist ein offenes, modulares und einheitliches Trainingssystem für Sprachagenten, das aus drei Hauptmodulen besteht: einem Planungsmodul, einem Zuordnungsmodul und einem Ausführungsmodul. Das Planungsmodul lernt, komplexe Aufgaben in eine Sequenz von Teilzielen zu zerlegen. Das Zuordnungsmodul übersetzt diese Teilziele in ausführbare Aktionen, die dann vom Ausführungsmodul umgesetzt werden. LUMOS bietet zwei Formulierungen für das Training und die Inferenz von Agenten: LUMOS-OnePass (LUMOS-O) und LUMOS-Iterative (LUMOS-I). LUMOS-O ist eine effiziente Formulierung, bei der alle Teilziele und Aktionen in einem einzigen Inferenzschritt generiert werden. LUMOS-I ist eine adaptive Formulierung, bei der die Agenten basierend auf den Ausführungsergebnissen flexibel planen können.
Um LUMOS mit hochwertigen Trainingsdaten zu versorgen, nutzen wir starke Sprachmodelle, um Annotationen aus bestehenden Benchmarks in ein einheitliches Format zu überführen. Auf diese Weise konnten wir rund 56.000 Annotationen für das Multi-Aufgaben-Training von Agenten erstellen.
Die Evaluation zeigt, dass LUMOS die Leistung verschiedener Open-Source-Agenten auf einer Reihe komplexer interaktiver Aufgaben wie Frage-Antwort, Webaufgaben, Mathematik und multimodale Aufgaben übertrifft. Darüber hinaus demonstriert LUMOS eine starke Generalisierungsfähigkeit auf ungesehene Aufgaben, indem es sogar größere Agenten übertrifft.
翻譯成其他語言
從原文內容
arxiv.org
深入探究