本論文提出了FedSARSA算法,這是一種新穎的連邦版本的線性SARSA算法。我們提供了FedSARSA的詳細非漸近性能分析,證明了在異質環境下,FedSARSA可以有效地加速每個代理的學習過程,並達到近最優的性能。