Modellfreies Reinforcement-Lernen der semantischen Kommunikation durch stochastischen Richtungsgradienten
Durch Anwendung des stochastischen Richtungsgradienten (SPG) können semantische Kommunikationssysteme modellunabhängig durch Reinforcement-Lernen optimiert werden, ohne eine bekannte oder differenzierbare Kanalmodellierung zu benötigen.