מושגי ליבה
Große Sprachmodelle können erfolgreich für die Klassifizierung von Mehrfachwahlaufgaben in verschiedenen medizinischen Fachgebieten eingesetzt werden.
תקציר
In dieser Studie wird untersucht, ob große Sprachmodelle, die auf Daten von Mehrfachwahlaufgaben trainiert wurden, zur Unterscheidung zwischen medizinischen Fachgebieten verwendet werden können. Dies ist eine wichtige und anspruchsvolle Aufgabe für die automatische Beantwortung von Fragen.
Um dieses Ziel zu erreichen, werden tiefe neuronale Netzwerke für die Mehrklassenklassifizierung von Fragen in die abgeleiteten medizinischen Fachgebiete trainiert. Mit der MQ-Sequence-BERT-Methode übertreffen wir die bisherigen Spitzenergebnisse auf dem MedMCQA-Datensatz mit einer Genauigkeit von 0,68 auf dem Entwicklungsdatensatz und 0,60 auf dem Testdatensatz. Damit zeigen wir die Fähigkeiten von KI und insbesondere großen Sprachmodellen für Mehrklassenklassifizierungsaufgaben im Gesundheitsbereich.
Der MedMCQA-Datensatz ist ein großer Datensatz mit über 194.000 hochwertigen Multiple-Choice-Fragen aus medizinischen Aufnahmeprüfungen, die 21 medizinische Fachgebiete abdecken. Die Baseline-Experimente mit den aktuellen State-of-the-Art-Methoden konnten nur 47% der Fragen korrekt beantworten, was weit hinter der Leistung menschlicher Kandidaten zurückblieb.
Unsere Experimente zeigten, dass unser MQ-Sequence-BERT die bisherigen Spitzenergebnisse sowohl auf dem Entwicklungsdatensatz als auch leicht auf dem Testdatensatz übertrifft. Die Ergebnisse zeigen die Fähigkeiten von KI und insbesondere des Feinabstimmens großer Sprachmodelle, Mehrfachwahlaufgaben für die automatische Beantwortung von Fragen im medizinischen Bereich zu klassifizieren.
סטטיסטיקה
Es gibt keine spezifischen Statistiken oder Kennzahlen, die aus dem Artikel extrahiert werden können.
ציטוטים
Es gibt keine hervorstechenden Zitate, die aus dem Artikel extrahiert werden können.