Core Concepts
Große Sprachmodelle können als autonome Agenten eingesetzt werden, um Raumfahrzeuge in nicht-kooperativen Weltraummissionen zu steuern.
Abstract
In dieser Arbeit wird untersucht, wie Große Sprachmodelle (Large Language Models, LLMs) als autonome Agenten eingesetzt werden können, um Raumfahrzeuge in nicht-kooperativen Weltraummissionen zu steuern. Dafür wurde das Kerbal Space Program Differential Games (KSPDG) Umfeld verwendet, das verschiedene Szenarien wie Verfolger-Ausweicher und Zielverteidigung simuliert.
Die Autoren entwickelten eine LLM-basierte Lösung, die in einem öffentlichen Wettbewerb den zweiten Platz belegte. Dafür wurden verschiedene Techniken wie Prompt-Engineering, Few-Shot-Prompting und Fine-Tuning eingesetzt, um die Leistung des LLMs zu optimieren.
Die Ergebnisse zeigen, dass LLMs effektiv als autonome Agenten für Raumfahrzeugsteuerung eingesetzt werden können. Im Vergleich zu traditionellen Reinforcement-Learning-Ansätzen bieten LLMs Vorteile wie eine höhere Stichprobeneffizienz und die Möglichkeit, komplexe Aufgaben ohne explizit definierte Belohnungsfunktionen zu lösen.
Die Autoren diskutieren auch die Herausforderungen bei der Integration von LLMs in kritische Weltraummissionen, wie die Sicherstellung der Zuverlässigkeit und Interpretierbarkeit der Entscheidungsfindung. Abschließend werden Möglichkeiten für zukünftige Forschung aufgezeigt, wie der Einsatz von LLMs in anderen Weltraumanwendungen und die Skalierung der Feinabstimmung mit größeren Datensätzen.
Stats
Die Verfolgungsfahrzeugposition (x,y,z) beträgt (750044.3, -18124.4, 1.0) Meter.
Die Ausweichfahrzeugposition (x,y,z) beträgt (749797.9, -17108.9, -0.0) Meter.
Die relative Position (Verfolger minus Ausweicher) beträgt (246.4, -1015.5, 1.0) Meter.
Der Abstand beträgt 1044.9 Meter.
Die Richtung, in die beschleunigt werden muss, um den Ausweicher zu erreichen, ist (-0.24, 0.97, -0.0).
Die relative Geschwindigkeit (Verfolger minus Ausweicher) beträgt (-0.41, 27.55, 0.02) Meter pro Sekunde.
Der simulierte Zeitpunkt des nächsten Annäherungsminimums ist in 37 Sekunden.
Die relative Position beim Annäherungsminimum beträgt (233.8, 7.7, 1.8) Meter.
Der Abstand beim Annäherungsminimum beträgt 234.0 Meter.
Die Richtung, in die beschleunigt werden muss, um den Ausweicher beim Annäherungsminimum zu erreichen, ist (-1.0, -0.03, -0.01).
Die relative Geschwindigkeit (Verfolger minus Ausweicher) beim Annäherungsminimum beträgt (-0.27, 27.71, 0.02) Meter pro Sekunde.
Quotes
"Wir müssen aufhören, in Richtung der aktuellen Ausweicherposition zu beschleunigen. Stattdessen lasst uns den Ausweicher abfangen, indem wir in Richtung des Zustands beim Annäherungsminimum beschleunigen, der (-0.75, 0.66, -0.0) ist."