Umfassende Bewertung der Qualität von KI-generierten Bildern durch Integration von Textbeschreibungen
Wir stellen ein multimodales Framework namens IP-IQA vor, das sowohl Bilder als auch zugehörige Textbeschreibungen berücksichtigt, um die Qualität von KI-generierten Bildern umfassend zu bewerten. Unser Ansatz überwindet die Beschränkungen herkömmlicher Bildqualitätsbewertungsmethoden, die nur auf visuelle Aspekte fokussieren, und integriert stattdessen die Beziehung zwischen Bild und Text, um eine ganzheitliche Bewertung zu ermöglichen.