핵심 개념
Wir stellen Control-DAG vor, einen eingeschränkten Decodieralgorithmus für unser Directed Acyclic T5 (DA-T5)-Modell, der lexikalische, Vokabular- und Längensteuerung bietet. Wir zeigen, dass Control-DAG DA-T5 auf den Schema Guided Dialogue- und DART-Datensätzen deutlich verbessert und starke nicht-autoregressive Ergebnisse für dialogorientierte und datengesteuerte Textgenerierung erzielt.
초록
Die Studie stellt einen Ansatz zur nicht-autoregressiven Textgenerierung mit Directed Acyclic Transformer (DAT) vor, der auf dem T5-Modell basiert (DA-T5). DAT-Modelle haben sich in der neuronalen Maschinellen Übersetzung bewährt, zeigen aber Schwächen bei der Textgenerierung für dialogorientierte und datengesteuerte Aufgaben, wie häufige Out-of-Vocabulary-Fehler und Probleme bei der korrekten Generierung von Entitätsnamen.
Um diese Probleme zu lösen, führen die Autoren Control-DAG ein, einen eingeschränkten Decodieralgorithmus für DA-T5. Control-DAG verwendet gewichtete endliche Zustandsautomaten (WFSA), um lexikalische, Vokabular- und Längenkontrolle in den Decodierungsprozess zu integrieren:
- Lexikalische Kontrolle: Durch Schnittmengenbildung der WFSA mit FSAs, die bestimmte Phrasen akzeptieren, wird sichergestellt, dass diese Phrasen im generierten Text enthalten sind.
- Vokabularkontrolle: Durch Schnittmengenbildung mit einem FSA, der nur gültige Vokabularwörter akzeptiert, werden Out-of-Vocabulary-Fehler vermieden.
- Längenkontrolle: Durch einen modifizierten Viterbi-Decodieralgorithmus (DFS-Viterbi) wird die Länge des generierten Texts an eine Zielgröße angepasst.
Die Autoren evaluieren Control-DAG auf den Schema Guided Dialogue (SGD)- und DART-Datensätzen für dialogorientierte und datengesteuerte Textgenerierung. Die Ergebnisse zeigen, dass Control-DAG die Leistung von DA-T5 deutlich verbessert, indem es Out-of-Vocabulary-Fehler und Fehler bei der Generierung von Entitätsnamen eliminiert, während es gleichzeitig eine Geschwindigkeitsverbesserung gegenüber autoregressiven Modellen erzielt.
통계
Die Zugfahrt startet um 9.50 Uhr vom Bahnhof Cambridge.
Die Zugfahrt startet um 11.30 Uhr vom Bahnhof Peachtree.
인용구
"Control-DAG signifikant die Leistung von DA-T5 auf den Schema Guided Dialogue- und DART-Datensätzen verbessert, indem es Out-of-Vocabulary-Fehler und Fehler bei der Generierung von Entitätsnamen eliminiert, während es gleichzeitig eine Geschwindigkeitsverbesserung gegenüber autoregressiven Modellen erzielt."
"Wir stellen Control-DAG vor, einen eingeschränkten Decodieralgorithmus für unser Directed Acyclic T5 (DA-T5)-Modell, der lexikalische, Vokabular- und Längensteuerung bietet."