Core Concepts
Ein effizienterer Algorithmus zur gleichzeitigen Berechnung der Präfixwahrscheinlichkeiten aller Präfixe einer Zeichenkette unter einer probabilistischen kontextfreien Grammatik.
Abstract
Der Artikel präsentiert einen verbesserten Algorithmus zur effizienten Berechnung von Präfixwahrscheinlichkeiten unter einer probabilistischen kontextfreien Grammatik (PCFG).
Der Algorithmus baut auf dem Jelinek-Lafferty-Algorithmus auf, der eine Laufzeit von O(N³|N|³ + |N|⁴) hat, wobei N die Länge der Eingabe und |N| die Anzahl der Nichtterminale in der Grammatik ist. Der vorgestellte Algorithmus hat eine Laufzeit von O(N²|N|³ + N³|N|²) und ist damit der schnellste bekannte Algorithmus für dichte Grammatiken in Chomsky-Normalform.
Der Algorithmus berechnet zunächst die Linkskanten-Erwartungen ξ(Y|X) und ξ(YZ|X) effizient mithilfe der Kleene-Hülle der Übergangsmatrix. Darauf aufbauend wird die Präfixwahrscheinlichkeit π(i,X,k) rekursiv berechnet, indem zusätzliche Zwischenergebnisse in den Tabellen γ und δ gespeichert werden.
Der Artikel zeigt auch, wie der Algorithmus auf semiring-gewichtete kontextfreie Grammatiken verallgemeinert werden kann, ohne die asymptotische Laufzeit zu verändern.
Stats
N ist die Länge der Eingabe.
|N| ist die Anzahl der Nichtterminale in der Grammatik.
|G| ist die Größe der Grammatik, also die Summe der Symbole in allen Produktionsregeln.
Quotes
Keine relevanten Zitate gefunden.