Benchmark zur Halluzination in der medizinischen visuellen Fragebeantwortung
Die Studie erstellt einen Benchmark-Datensatz zur Bewertung der Halluzinationsanfälligkeit von Modellen für die medizinische visuelle Fragebeantwortung und führt eine umfassende Evaluierung der aktuellen Spitzenmodelle durch.