Core Concepts
Dieser Beitrag beschreibt die Teilnahme der Toronto Metropolitan University an der TREC Clinical Trials Track 2023. Durch den Einsatz fortschrittlicher Verarbeitungstechniken und neuronaler Sprachmodelle wurden die relevantesten klinischen Studien für gegebene Patientenprofile identifiziert.
Abstract
In diesem Beitrag wird die Teilnahme der Toronto Metropolitan University an der TREC Clinical Trials Track 2023 beschrieben.
Die Autoren nutzen fortschrittliche Verarbeitungstechniken und neuronale Sprachmodelle, um die relevantesten klinischen Studien für gegebene Patientenprofile zu identifizieren. Dazu extrahieren sie zunächst Informationen aus den XML-Daten der klinischen Studien, insbesondere Zusammenfassungen, Beschreibungen, Identifikationsinformationen und Teilnahmekriterien. Anschließend wenden sie zwei verschiedene Methoden zur Merkmalsextraktion an: Sentence Transformer und Doc2Vec. Damit berechnen sie die semantische Ähnlichkeit zwischen den Patientenprofilen und den Studienbeschreibungen und ranken die Studien entsprechend.
Die Autoren haben vier verschiedene Läufe eingereicht, wobei die auf dem Sentence Transformer-Modell basierenden Läufe bessere Ergebnisse erzielten. Die Evaluation anhand des NDCG-Maßes zeigt, dass der Sentence Transformer-basierte Ansatz eine höhere Genauigkeit bei der Identifizierung geeigneter klinischer Studien erreicht.
Insgesamt demonstriert der Beitrag, wie fortschrittliche Sprachverarbeitungstechniken erfolgreich eingesetzt werden können, um aus unstrukturierten Patienteninformationen die am besten passenden klinischen Studien zu finden.
Stats
Die Cosinus-Ähnlichkeit zwischen einem Patientenprofil t und einer Studienbeschreibung d wird wie folgt berechnet:
Cosinus-Ähnlichkeit(t, d) = t · d / (‖t‖ · ‖d‖)
Quotes
Keine relevanten Zitate identifiziert.