이 연구는 당뇨병성 족부 궤양(DFU) 이미지 전사를 위해 대규모 언어 및 비전 모델을 활용하는 새로운 다중 모달 접근법인 UlcerGPT를 소개한다.
주요 내용은 다음과 같다:
대규모 언어 모델(LLM)인 GPT-4omni, Qwen-VL, LLaVA와 다양한 언어 모델 백본을 활용하여 DFU 이미지를 전사하고 분석하는 방법을 제안했다.
전문가 의사들이 평가한 결과, GPT-4omni가 가장 우수한 성능을 보였다. 이는 DFU의 핵심 임상 특징과 관련 세부 사항을 정확하게 포착할 수 있음을 시사한다.
오픈소스 모델인 Qwen-VL도 우수한 성능을 보였지만, GPT-4omni에 비해 DFU 설명에 일부 세부 사항이 누락되는 경향이 있었다.
LLaVA 모델 조합은 임상 정확성, 포괄성, 위치 정확성, 진단 유용성 측면에서 상대적으로 낮은 성능을 보였다.
이러한 결과는 DFU 관리를 위한 원격 의료 시스템에서 LLM의 활용 가능성을 보여준다. 특히 GPT-4omni와 같은 고성능 모델은 의사의 업무를 지원하고 환자 기록의 일관성을 높일 수 있을 것으로 기대된다.
翻譯成其他語言
從原文內容
arxiv.org
深入探究