Die Studie führt eine umfassende Fairness-Analyse von zwei weit verbreiteten Vision-Sprache-Modellen (CLIP und BLIP2) auf dem FairVLMed-Datensatz durch. Die Ergebnisse zeigen erhebliche Voreingenommenheiten in allen Modellen, wobei Asiaten, Männer, Nicht-Hispanier und Spanischsprachige die bevorzugten Untergruppen sind. Um diese Voreingenommenheiten zu mildern, schlagen die Autoren FairCLIP vor, einen Optimal-Transport-basierten Ansatz, der einen günstigen Kompromiss zwischen Leistung und Fairness erzielt, indem der Sinkhorn-Abstand zwischen der Gesamtverteilung der Stichproben und den Verteilungen der einzelnen demografischen Gruppen reduziert wird.
To Another Language
from source content
arxiv.org
Principais Insights Extraídos De
by Yan Luo,Min ... às arxiv.org 04-01-2024
https://arxiv.org/pdf/2403.19949.pdfPerguntas Mais Profundas