Core Concepts
LLMs können Designentscheidungen generieren, erfordern jedoch weitere Forschung für menschenähnliche Leistung.
Abstract
Das Papier untersucht die Verwendung von Large Language Models (LLMs) zur Generierung von Architektur-Entscheidungsaufzeichnungen (ADR) in einer explorativen Studie. Es zeigt, dass LLMs Designentscheidungen generieren können, aber menschenähnliche Leistung erfordert weitere Forschung. Die Studie umfasst 0-shot, few-shot und Feinabstimmungsansätze und zeigt, dass kleinere, feinabgestimmte Modelle eine Alternative zu größeren Modellen darstellen können.
Struktur:
Einleitung
Hintergrund
Studiendesign und Durchführung
Ergebnisse
Diskussion
Validitätsbedrohungen
Schlussfolgerung und zukünftige Arbeit
Stats
ADRs sind ein wesentlicher Bestandteil des AKM.
GPT-4 erzielt die besten Ergebnisse in 0-shot-Ansätzen.
GPT-3.5-text-davinci-003 zeigt die besten Ergebnisse in few-shot-Ansätzen.
Flan-T5-base erzielt nach der Feinabstimmung vergleichbare Ergebnisse.
Quotes
"LLMs können Designentscheidungen generieren, erfordern jedoch weitere Forschung für menschenähnliche Leistung."