In dieser Arbeit wird eine neue arabische Programmiersprache namens APL (Arabic Programming Language) vorgestellt, die Großsprachmodelle (LLMs) als Halbcompiler verwendet, um arabischen Quellcode in ausführbaren Python-Code zu übersetzen.
Die Architektur des Compilers umfasst drei Hauptkomponenten: den LLM-Planer, die Task-Fetch-Einheit und den Executor. Der LLM-Planer übersetzt die arabische Programmiersprache in eine Reihe von Anweisungen für den Executor. Die Task-Fetch-Einheit ruft dann die entsprechenden LLM-Funktionen auf, um den Python-Code zu generieren. Der Executor führt schließlich den generierten Python-Code aus.
Die Arbeit beschreibt auch die Prompt-Engineering-Techniken, die verwendet werden, um die arabischen Schlüsselwörter in ihre Python-Äquivalente zu übersetzen und eine korrekte Syntax des Ausgabe-Python-Codes sicherzustellen.
Darüber hinaus wird eine API und Benutzeroberfläche für die APL-Programmiersprache vorgestellt, die eine nahtlose Integration in bestehende Python-Umgebungen ermöglicht. Verschiedene Codebeispiele veranschaulichen die Leistungsfähigkeit des Systems bei der Übersetzung von grundlegenden bis hin zu komplexeren Programmierkonzepten.
Die Hauptherausforderungen bei der Entwicklung des Compilers waren das Prompt-Engineering, um die arabischen Schlüsselwörter korrekt in Python zu übersetzen, sowie die Kosten für die Nutzung der GPT-4-API. Zukünftige Arbeiten könnten sich darauf konzentrieren, ein eigenes, auf diese Aufgabe abgestimmtes Sprachmodell zu feinabstimmen, um die Kosten zu senken und die Leistung weiter zu verbessern.
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문