Multimodale kontextuelle Erkennung von Dialogstörungen für KI-Modelle für Konversationen
Ein multimodales kontextuelles Modell zur Erkennung von Dialogstörungen in Echtzeit, das Audioaufnahmen und transkribierte Texte verarbeitet, um Probleme in Konversationen zwischen Nutzern und KI-Agenten zu erkennen und zu beheben.