Core Concepts
Die Studie untersucht die Leistung von GPT-4 und GPT-3.5 in mono- und mehrsprachigen rechtlichen Frage-Antwort-Systemen unter Verwendung des COLIEE Task 4-Datensatzes. Die Ergebnisse zeigen die Überlegenheit von GPT-4 gegenüber GPT-3.5 und beleuchten die Herausforderungen, die GPT-Modelle bei der Handhabung sprachlicher Nuancen in mehrsprachigen Kontexten bewältigen müssen.
Abstract
Die Studie untersucht die Leistung von GPT-4 und GPT-3.5 in mono- und mehrsprachigen rechtlichen Frage-Antwort-Systemen unter Verwendung des COLIEE Task 4-Datensatzes.
Zunächst wird eine Datenanalyse durchgeführt, um die Charakteristika des Datensatzes in Bezug auf Länge und Komplexität der Kontexte und Fragen in Englisch und Japanisch zu verstehen.
Anschließend werden die Modelle in vier verschiedenen Einstellungen getestet: Englischer Kontext und Englische Frage (EN-EN), Japanischer Kontext und Japanische Frage (JA-JA) sowie zwei mehrsprachige Einstellungen: Englischer Kontext mit Japanischer Frage (EN-JA) und Japanischer Kontext mit Englischer Frage (JA-EN).
Die Ergebnisse zeigen, dass GPT-4 in allen Einstellungen konsistent besser abschneidet als GPT-3.5. Außerdem erzielen die Modelle in den monolingualen Einstellungen generell höhere Genauigkeitswerte als in den mehrsprachigen Einstellungen.
Die Beobachtung, dass die japanische monolinguale Leistung besser ist als die englische monolinguale Leistung, wird darauf zurückgeführt, dass die Originaldaten in Japanisch vorlagen und die Modelle möglicherweise effektiver mit dem Japanischen umgehen konnten.
Insgesamt tragen die Erkenntnisse dazu bei, die Herausforderungen und Potenziale von GPT-Modellen in mehrsprachigen rechtlichen Frage-Antwort-Systemen besser zu verstehen. Zukünftige Forschung sollte sich darauf konzentrieren, die mehrsprachigen Fähigkeiten der GPT-Modelle weiter zu verbessern und domänenspezifisches Wissen für den Rechtsbereich zu integrieren.
Stats
Die durchschnittliche Länge der Kontexte in Englisch variiert von 525 Zeichen (H30) bis 703 Zeichen (R03).
Die durchschnittliche Länge der Kontexte in Japanisch reicht von 110 Zeichen (H30) bis 213 Zeichen (R03).
Die durchschnittliche Länge der Fragen in Englisch schwankt zwischen 200 Zeichen (R01) und 273 Zeichen (H29).
Die durchschnittliche Länge der Fragen in Japanisch liegt zwischen 72 Zeichen (H30) und 88 Zeichen (R02).
Quotes
Keine relevanten Zitate identifiziert.