Core Concepts
Eine Methode zur Evaluierung und zum Vergleich von KI/ML-Modellen über multiple theoretische, wissenschaftliche und praktische Kriterien hinweg, um die Entwicklung wissensgeleiteter Modelle zu fördern.
Abstract
Dieser Artikel beschreibt ein allgemeingültiges Modell-Evaluierungsverfahren, das an verschiedene Kontexte angepasst werden kann, um KI/ML-Modelle anhand multipler Kriterien, einschließlich wissenschaftlicher Prinzipien und praktischer Ergebnisse, zu bewerten.
Das Verfahren entstand aus Vorhersage-Wettbewerben in Psychologie und Entscheidungswissenschaft. Es evaluiert eine Gruppe von Kandidatenmodellen unterschiedlicher Art und Struktur anhand multipler wissenschaftlicher, theoretischer und praktischer Kriterien. Die ordinale Rangfolge der Kriterienwerte wird mithilfe von Abstimmungsregeln aus dem Bereich der computergestützten Sozialwahltheorie bewertet, was den Vergleich divergierender Maße und Modelltypen in einer ganzheitlichen Bewertung ermöglicht. Weitere Vorteile und Anwendungsmöglichkeiten werden diskutiert.
Stats
Keinen relevanten Datenpunkt identifiziert.
Quotes
Keinen relevanten Zitat identifiziert.