Core Concepts
Durch den Einsatz von Google-Suchanzeigen ist es möglich, einen vielfältigen und repräsentativen Datensatz zu Hautkrankheiten zu erstellen, der die Realität besser widerspiegelt als klinisch erhobene Datensätze.
Abstract
Der Artikel beschreibt die Erstellung des "Skin Condition Image Network" (SCIN) Datensatzes, einer offenen Ressource mit 10.408 Bildern von Hautkrankheiten, die über einen Zeitraum von 8 Monaten durch Crowdsourcing mit Google-Suchanzeigen gesammelt wurden.
Gliederung:
Einleitung
Herausforderungen bei der Erstellung repräsentativer Gesundheitsdatensätze aus klinischen Quellen
Dermatologie als geeignetes Anwendungsfeld für ein neuartiges, skalierbares Datenerstellungsverfahren
Methoden
Verwendung von Google-Suchanzeigen, um Beiträge zu einem offenen Datensatz von Dermatologie-Bildern, demografischen Informationen und Symptomen zu sammeln
Informiertes Einverständnis der Beitragenden, Datenkuration und Anonymisierung
Labeling der Bilder durch Dermatologen
Ergebnisse
Effektivität des Crowdsourcing-Ansatzes: Durchschnittlich 22 Beiträge pro Tag über 8 Monate
Repräsentativität des Datensatzes: Höhere Beteiligung von Frauen und jüngeren Personen, 32,6% der Beitragenden mit nicht-weißer rassischer oder ethnischer Identität
Inhalt des Datensatzes: Überwiegend häufige, kurzfristige, allergische, infektiöse oder entzündliche Hauterkrankungen, breite Verteilung über Fitzpatrick-Hauttypen
Diskussion
Vorteile und Grenzen des Crowdsourcing-Ansatzes im Vergleich zu klinisch erhobenen Datensätzen
Potenzielle Anwendungen des SCIN-Datensatzes in Forschung, medizinischer Ausbildung und KI-Entwicklung
Notwendigkeit weiterer Forschung zur Skalierung des Ansatzes unter Berücksichtigung von Datenschutz und Repräsentativität
Stats
19,4% der Beiträge zeigten Hauterkrankungen, die erst seit weniger als einem Tag bestanden.
54% der Beiträge betrafen Hauterkrankungen, die seit weniger als einer Woche aufgetreten waren.
89% der Beiträge waren allergische, infektiöse oder entzündliche Hauterkrankungen.
Quotes
"Suchanzeigen sind ein effektives Mittel, um Bilder von Gesundheitszuständen im großen Maßstab zu crowdsourcen."
"Der SCIN-Datensatz überbrückt wichtige Lücken bei der Verfügbarkeit repräsentativer Bilder zu häufigen Hauterkrankungen."