Kernkonzepte
Code-Stilometrie ist vielversprechend für die Unterscheidung zwischen von GPT-4 generiertem Code und menschlich verfasstem Code.
Zusammenfassung
Abstract:
KI-Assistenten wie GitHub Copilot und ChatGPT revolutionieren die Programmieraufgaben.
Forschung zur Unterscheidung zwischen GPT-4 generiertem und menschlichem Code.
Code-Stilometrie und maschinelles Lernen zur Unterscheidung verwendet.
Einführung:
KI-Tools wie GitHub Copilot und ChatGPT verändern die Art und Weise, wie Programmierkurse unterrichtet und bewertet werden.
Sorge um akademische Ehrlichkeit aufgrund von AI-generiertem Code.
Motivation und verwandte Arbeit:
Untersuchung von Code-Stilometrie zur Identifizierung von Code-Autorenschaft.
Anwendung von maschinellem Lernen auf Code-Analyse.
Studiendesign:
Datenerhebung von CodeChef-Problemen und menschlichen Lösungen.
Merkmalsextraktion für die Klassifizierung von GPT-4 generiertem Code.
Ergebnisse:
Klassifizierer mit F1-Score von 0,91 für die Unterscheidung von GPT-4 generiertem und menschlichem Code.
Einfluss von nicht-spielbaren Merkmalen auf die Klassifizierung.
Leistung des Klassifizierers bei korrekten Lösungen und unterschiedlichen Schwierigkeitsgraden.
Statistiken
Unser Klassifizierer erreichte einen F1-Score von 0,91 für die Unterscheidung von GPT-4 generiertem und menschlichem Code.