Der Artikel stellt einen neuen Ansatz für kontrollierbare Dialogsysteme vor, genannt Konversationsbaum-Suche (Conversational Tree Search, CTS). Dabei definieren Experten zunächst einen Dialogbaum, den ein Verstärkungslernen-Agent dann lernt, effizient zu navigieren. Der Agent kann sich dabei an die Informationsbedürfnisse unterschiedlicher Nutzer anpassen, indem er entscheidet, welche Knoten des Baums er überspringt oder durchläuft.
Der Artikel untersucht, wie dieser Ansatz ohne zusätzliche Trainingsdaten skaliert werden kann, indem der Dialogbaum direkt zur Generierung synthetischer Trainingsdaten verwendet wird. Dazu werden verschiedene Methoden zum Generieren von Nutzerfragen und -antworten getestet. Die generierten Daten erzielen in Simulationen vergleichbare Leistung wie Modelle, die auf menschlichen Daten trainiert wurden. Auch in Tests mit realen Nutzern zeigen sich keine signifikanten Unterschiede zwischen Modellen, die auf generierten oder menschlichen Daten trainiert wurden.
Zusätzlich werden zwei neue Datensätze für den medizinischen Bereich und für Informationen zum Umzug in eine neue Stadt vorgestellt, an denen die Skalierbarkeit des Ansatzes evaluiert wird.
翻譯成其他語言
從原文內容
arxiv.org
深入探究