核心概念
Das Kernkonzept dieses Artikels ist, ein neuartiges Prompt-Reformulierungsmodell zu entwickeln, das die individuellen Fähigkeiten des Nutzers in den Reformulierungsprozess integriert, um die Qualität der generierten Bilder zu verbessern.
摘要
Der Artikel befasst sich mit der Herausforderung der Prompt-Reformulierung in Text-zu-Bild-Generierungssystemen. Im Gegensatz zu Suchanfrage-Reformulierung in Suchmaschinen, hängt die Effektivität der Prompt-Reformulierung stark von den individuellen Fähigkeiten des Nutzers ab. Die Autoren analysieren Interaktionsprotokolle und stellen fest, dass die Qualität der Reformulierungen stark variiert und oft nur marginale Verbesserungen erzielt werden.
Basierend auf diesen Erkenntnissen entwickeln die Autoren das "Capability-aware Prompt Reformulation" (CAPR) Framework. CAPR besteht aus zwei Komponenten: Dem "Conditional Reformulation Model" (CRM), das Prompts entsprechend der Nutzerfähigkeiten reformuliert, und den "Configurable Capability Features" (CCF), die die Nutzerfähigkeiten repräsentieren und die Reformulierung steuern.
Umfangreiche Experimente auf Standard-Benchmarks zeigen, dass CAPR die Leistung bestehender Ansätze deutlich übertrifft und auch auf unbekannte Text-zu-Bild-Systeme übertragbar ist. Die Analyse validiert die Effektivität der einzelnen Komponenten.
統計資料
Die ursprünglichen Prompts führen zu Bildern mit einer Gesamtqualität von {}.
Die überarbeiteten Prompts führen zu Bildern mit einer Gesamtqualität von {}.
引述
Keine relevanten Zitate gefunden.