In dieser Studie wird eine neue Methode namens PF-DDQN (Partikelfilter-Doppel-Tief-Q-Netzwerk) vorgestellt, um die Pfadplanung für mehrere AGVs in komplexen Umgebungen zu verbessern.
Die Kernidee ist es, Partikelfilter in den Doppel-Tief-Q-Netzwerk-Algorithmus zu integrieren, um die Ungenauigkeiten der Netzwerkgewichte zu reduzieren und die Konvergenzgeschwindigkeit zu erhöhen.
Der Partikelfilter wird verwendet, um den Systemzustand, d.h. die Netzwerkgewichte, zu schätzen, während das neuronale Netzwerk die Genauigkeit der Schätzung verbessert. Durch die Kombination der Lernfähigkeit neuronaler Netze und der Zustandsschätzung des Partikelfilters kann die PF-DDQN-Methode effizientere und genauere Pfade für mehrere AGVs in komplexen Umgebungen planen.
Die Simulationsergebnisse zeigen, dass die vorgeschlagene PF-DDQN-Methode im Vergleich zu herkömmlichen DDQN-Algorithmen eine um 92,62% höhere Pfadplanungsqualität und eine um 76,88% kürzere Trainingszeit aufweist. Damit löst die PF-DDQN-Methode die Herausforderungen, die RL-Planungsalgorithmen bei der Pfadplanung für AGVs haben.
To Another Language
from source content
arxiv.org
Viktige innsikter hentet fra
by Shao Shuo klokken arxiv.org 03-28-2024
https://arxiv.org/pdf/2403.18236.pdfDypere Spørsmål