Die Studie stellt eine neuartige automatisierte Methode vor, um GitHub-Repositorys, die in Forschungsarbeiten zur klinischen Informatik erwähnt werden, systematisch zu identifizieren und zu analysieren. Durch die Abfrage der arXiv-API nach relevanten Publikationen und die anschließende Extraktion der zugehörigen GitHub-URLs wird ein konsolidierter Bestand an Softwarewerkzeugen für die klinische Informatik erstellt.
Der Prozess umfasst die Bereinigung der extrahierten URLs, das Abrufen detaillierter Repositoryinformationen über die GitHub-API und die Bewertung der Reife der Repositorys anhand von Metriken wie Sterne, Forks, offene Issues und Mitwirkende. Dieser Reifegradansatz zielt nicht auf das Alter der Repositorys ab, sondern auf deren Komplexität und den Grad der Community-Beteiligung.
Die Ergebnisse zeigen, dass die Methode effektiv ist, um relevante, aber möglicherweise übersehene Repositorys zu identifizieren, die in der GitHub-Suche nicht auftauchen. Die Analyse der Reifegradstufen offenbart eine vielfältige Landschaft von Projekten mit unterschiedlichen Graden an Community-Engagement und Entwicklungsaktivität. Einige Repositorys weisen hohe Reifegradstufen auf, was auf aktiv gepflegte und potenziell nützliche Projekte hindeutet, während andere weitere Entwicklung und Unterstützung benötigen.
Die Studie schlägt auch die zukünftige Integration von Large Language Models (LLMs) vor, um automatisch Zusammenfassungen und Bewertungen der Repositorys zu erstellen und so die Wissensbasis mit kontextbezogenen Informationen über die Funktionalität und Anwendung der Tools anzureichern. Insgesamt bietet der vorgestellte Ansatz einen vielversprechenden Rahmen, um die Zugänglichkeit, Bewertung und Nutzung von Open-Source-Software in der klinischen Informatik-Community zu verbessern.
เป็นภาษาอื่น
จากเนื้อหาต้นฉบับ
arxiv.org
ข้อมูลเชิงลึกที่สำคัญจาก
by Jeremy R. Ha... ที่ arxiv.org 03-25-2024
https://arxiv.org/pdf/2403.14721.pdfสอบถามเพิ่มเติม