Der Artikel befasst sich mit der Herausforderung der Modellauswahl in Multi-Modell-Reasoning-Szenarien, bei denen Agenten mehrere KI-Modelle für die Lösung komplexer Aufgaben kombinieren.
Bestehende Methoden konzentrieren sich hauptsächlich auf die Planungs- und Ausführungsphase und verwenden in der Regel vordefinierte aufgabenspezifische Modelle für jede Teilaufgabe, was die Ausführung anfällig macht. Traditionelle Modellauswahlverfahren sind entweder inkompatibel oder suboptimal für Multi-Modell-Reasoning-Szenarien, da sie die Abhängigkeiten zwischen Teilaufgaben ignorieren.
Um diese Herausforderung anzugehen, stellen die Autoren das M3-Rahmenwerk vor, das die Beziehung zwischen Eingaben, ausgewählten Modellen und Aufgabenabhängigkeiten modelliert, um eine dynamische und robuste Modellauswahl zu ermöglichen. Außerdem führen sie den MS-GQA-Datensatz ein, um die Forschung in diesem Bereich zu fördern.
Die Experimente zeigen, dass M3 die Modellauswahl im Vergleich zu bestehenden Methoden deutlich verbessert, ohne dabei die Effizienz zu beeinträchtigen. M3 ist robust gegenüber fehlenden Trainingsdaten und übertrifft andere Ansätze auch unter Zeitbeschränkungen.
To Another Language
from source content
arxiv.org
Дополнительные вопросы