Dieser Artikel entwickelt einen konzeptuellen Rahmen für die Interaktionen zwischen Agenten und Nutzern während des konversationellen Suchprozesses. Der Rahmen identifiziert die verschiedenen Aktionen und Absichten, die Nutzer und Agenten ausführen, sowie die Schlüsselentscheidungen, die Agenten treffen müssen, um den Suchprozess erfolgreich und zufriedenstellend abzuschließen.
Die effektive Kommunikation von Datenunsicherheit erfordert eine abgestimmte Strategie, die die Stärken verschiedener Modalitäten wie Sprache, Text und Visualisierung nutzt.
Große Sprachmodelle können die Absichten von Menschen während einer Zusammenarbeit mit einem Roboter bei einer Objektkategorisierungsaufgabe vorhersagen, indem sie verbale und nonverbale Hinweise kombinieren.
Basierend auf einer empirischen Studie mit Designern und Nutzern wurde ein Wörterbuch mit den geeignetsten berührungslosen Gesten für die Interaktion mit Webanwendungen erstellt.
Direkte Manipulationsprinzipien können die Interaktion mit großen Sprachmodellen verbessern, indem sie eine kontinuierliche Darstellung der generierten Objekte, physische Aktionen zur Lokalisierung und Referenzierung, wiederverwendbare Befehle sowie Rückgängigmachen und Wiederholen von Operationen ermöglichen.
Generative KI-Modelle können eine effiziente und skalierbare Möglichkeit bieten, akademische Erkenntnisse in ein präskriptives Format wie Gestaltungskarten zu übersetzen, ohne dass Forscher und Designer erheblichen Zeit- und Arbeitsaufwand betreiben müssen.