Die Studie beschäftigt sich mit der Entwicklung und Bewertung von Vorhersagemodellen auf Basis von Maschinellem Lernen, um Personen mit Risiko für Typ-2-Diabetes und Prädiabetes in Argentinien zu identifizieren. Dafür wurde die Datenbank des PPDBA-Programms verwendet.
Zunächst wurde die Datenbank sorgfältig bereinigt und drei spezifische Datensätze (CLD-bin, CGD-bin und CD-bin) mit unterschiedlichen Kompromissen zwischen der Anzahl der Variablen und der verfügbaren Datensätze erstellt. Anschließend wurden 5 verschiedene Klassifikationsmodelle auf jeden der Datensätze angewendet.
Die Ergebnisse zeigen, dass einige der vorgeschlagenen Modelle sehr gute Leistungen für die ersten beiden Datensätze erzielen konnten. Insbesondere Random Forest, Entscheidungsbäume und Künstliche Neuronale Netze zeigten eine große Klassifizierungskraft mit hohen Werten für die betrachteten Metriken. Im Gegensatz dazu führte das Entfernen aller Labordaten zu schlechten Leistungsergebnissen.
Aufgrund der Einschränkungen der Datenbank sind die Ergebnisse nicht abschließend, aber vielversprechend. Angesichts des Fehlens solcher Werkzeuge in Argentinien stellt diese Arbeit den ersten Schritt zu komplexeren Modellen dar.
לשפה אחרת
מתוכן המקור
arxiv.org
שאלות מעמיקות