Core Concepts
대규모 다중 모달 모델을 활용하여 병리 보고서에서 정보를 자동으로 추출하고 표준화된 보고서를 생성하며, 추출된 정보의 신뢰도를 평가하고 이를 바탕으로 환자 예후를 분석할 수 있다.
Abstract
이 연구는 대규모 다중 모달 모델(LMM)을 활용하여 병리 보고서의 정보를 자동으로 추출하고 표준화하는 실용적인 접근법을 제안한다. 제안된 프레임워크는 두 단계의 프롬프팅을 통해 정보를 추출하고 추출된 정보의 정확성을 검증한다. 추출된 정보에는 신뢰도 점수가 함께 제공되어 사용자가 정확도가 높은 정보만 선별적으로 사용할 수 있다.
연구 결과, 제안된 접근법은 다양한 형식의 병리 보고서에 효과적으로 적용될 수 있으며, 추출된 정보의 신뢰도 점수가 실제 정확도를 잘 반영하는 것으로 나타났다. 또한 표준화된 병리 보고서 정보와 보고서 임베딩 모두 환자 생존 예측에 유의미한 예후 정보를 제공하는 것으로 확인되었다.
이 연구는 병리 보고서의 자동 정보 추출 및 표준화, 신뢰도 평가, 예후 분석 등 다양한 측면에서 기여하며, 개발된 웹 페이지를 통해 병리학자들이 활용할 수 있도록 공개되었다.
Stats
병리 보고서 추출 정확도가 가장 높은 필드는 림프절 상태(AUROC 0.93)와 종양 유형(AUROC 0.89)이었다.
추출된 필드 값을 이용한 생존 예측 모델의 C-index는 0.74±0.04로 높은 수준의 예후 예측 성능을 보였다.
생존 예측 모델에서 가장 중요한 특징은 원격 전이 상태, 국소 침윤 상태, 림프절 상태 순이었다.
Quotes
"병리 보고서는 임상적 및 병리학적 세부 정보가 풍부하지만 종종 자유 텍스트 형식으로 제시된다. 이러한 보고서의 비구조화된 특성은 내용에 대한 접근성을 크게 제한한다."
"제안된 접근법은 추출된 필드의 정확성에 대한 신뢰도 점수를 제공하여 실용적인 사용을 가능하게 한다."