In dieser Arbeit wird eine neue arabische Programmiersprache namens APL (Arabic Programming Language) vorgestellt, die Großsprachmodelle (LLMs) als Halbcompiler verwendet, um arabischen Quellcode in ausführbaren Python-Code zu übersetzen.
Die Architektur des Compilers umfasst drei Hauptkomponenten: den LLM-Planer, die Task-Fetch-Einheit und den Executor. Der LLM-Planer übersetzt die arabische Programmiersprache in eine Reihe von Anweisungen für den Executor. Die Task-Fetch-Einheit ruft dann die entsprechenden LLM-Funktionen auf, um den Python-Code zu generieren. Der Executor führt schließlich den generierten Python-Code aus.
Die Arbeit beschreibt auch die Prompt-Engineering-Techniken, die verwendet werden, um die arabischen Schlüsselwörter in ihre Python-Äquivalente zu übersetzen und eine korrekte Syntax des Ausgabe-Python-Codes sicherzustellen.
Darüber hinaus wird eine API und Benutzeroberfläche für die APL-Programmiersprache vorgestellt, die eine nahtlose Integration in bestehende Python-Umgebungen ermöglicht. Verschiedene Codebeispiele veranschaulichen die Leistungsfähigkeit des Systems bei der Übersetzung von grundlegenden bis hin zu komplexeren Programmierkonzepten.
Die Hauptherausforderungen bei der Entwicklung des Compilers waren das Prompt-Engineering, um die arabischen Schlüsselwörter korrekt in Python zu übersetzen, sowie die Kosten für die Nutzung der GPT-4-API. Zukünftige Arbeiten könnten sich darauf konzentrieren, ein eigenes, auf diese Aufgabe abgestimmtes Sprachmodell zu feinabstimmen, um die Kosten zu senken und die Leistung weiter zu verbessern.
Vers une autre langue
à partir du contenu source
arxiv.org
Questions plus approfondies