Natürliche Interaktion zwischen Menschen und autonomen Agenten durch vortrainierte Sprach- und Bildmodelle
Unser Rahmenwerk ermöglicht es Menschen, natürlich mit autonomen Agenten durch gesprochene und textbasierte Dialoge zu interagieren, indem es die inhärenten Fähigkeiten von vortrainierten Sprach- und Bildmodellen sowie Spracherkennungsmodellen nutzt.