핵심 개념
의사들의 부담을 줄이기 위해 CT 영상의 자동평가를 위한 시각-언어 LLM의 능력을 평가하는 새로운 평가 프레임워크를 제안합니다.
초록
CT 검사 증가로 인한 의사 부담
시각-언어 LLM의 잠재력
CT 결과 요약의 자동평가 방법 소개
GPT-4V 모델의 성능 평가
자동평가 결과와 의사 평가의 상관관계
모델 성능 개선을 위한 인사이트 제공
통계
"이러한 제한으로 인해 CT에 대한 동등한 자동 시스템이 현재 없습니다."
"이러한 점수는 의사로부터 얻은 것과 높은 상관관계를 보였습니다."
"GPT-4V는 평가에서 다른 모델들을 능가했습니다."
인용구
"CT 슬라이스에 이상 소견을 포함한 CT 슬라이스를 입력하여 이상 소견의 예측 특성에 대한 자유 텍스트 요약을 생성합니다."
"GPT-4V는 우리의 평가에서 다른 모델들을 능가했지만 여전히 전반적인 개선이 필요합니다."