Core Concepts
Es werden mehrere exakte und approximative mathematische Methoden und Open-Source-Software präsentiert, um die kumulierte Verteilungsfunktion (cdf), Wahrscheinlichkeitsdichtefunktion (pdf) und inverse kumulierte Verteilungsfunktion der verallgemeinerten Chi-Quadrat-Verteilung zu berechnen, die in Bayesschen Klassifikationsproblemen auftritt.
Abstract
Der Artikel präsentiert verschiedene Methoden zur effizienten Berechnung der verallgemeinerten Chi-Quadrat-Verteilung:
- Mapping der Verteilungsparameter auf die Koeffizienten einer quadratischen Form einer Multinormalverteilung, um die Verteilung zu charakterisieren.
- Ray-Tracing-Methode zur genauen Berechnung der cdf und pdf, insbesondere in den Verteilungsenden.
- Inverse Fourier-Transformations-Methode zur schnellen Berechnung der cdf und pdf.
- Ellipsen-Approximation für den endlichen Verteilungsbereich, die sehr genau und effizient ist.
Die Methoden haben unterschiedliche Vor- und Nachteile bezüglich Genauigkeit und Rechenzeit. Sie werden verglichen und ihre Anwendbarkeit für verschiedene Verteilungsformen diskutiert.
Stats
Die Verteilungsparameter w, k, λ, s und m beschreiben die quadratische Form der Multinormalverteilung, aus der die verallgemeinerte Chi-Quadrat-Verteilung resultiert.
Die Methoden können Wahrscheinlichkeiten bis hinunter zu etwa 10^-308 (realmin) berechnen, mit Verwendung von Gleitkomma-Arithmetik höherer Genauigkeit sogar bis etwa 10^-3*10^8 (symmin).
Quotes
"Wir glauben, dass niemand jemals eine so hohe Genauigkeit benötigen wird."
"Niemand sollte jemals mehr als 640 KB Arbeitsspeicher brauchen."