Core Concepts
해부학적 영역 감지와 임상 맥락 프롬프트를 활용하여 사전 훈련된 대규모 언어 모델(LLM)로 구조화된 흉부 X선 보고서를 생성합니다.
Abstract
이 연구는 구조화된 보고서 생성, 해석 가능성 및 상호작용성을 높이기 위해 해부학적 영역 감지와 임상 맥락 프롬프트를 활용하는 방법을 제안합니다.
첫째, 흉부 X선 영상에서 해부학적 영역을 감지하여 해당 영역 중심의 문장을 생성함으로써 구조화된 보고서의 기반을 마련합니다. 또한 감지된 해부학적 정보를 텍스트 프롬프트로 변환하여 후속 모듈에서 해부학적 이해를 높입니다.
둘째, 의사가 제공하는 환자의 병력 및 검사 사유 등의 임상 맥락 정보를 프롬프트에 포함시켜 상호작용성을 높입니다. 이를 통해 의사가 보고서 생성 과정에 개입하여 환자 상황에 맞게 조정할 수 있습니다.
마지막으로, 해부학적 영역 기술, 해부학 프롬프트, 임상 맥락 프롬프트를 대규모 언어 모델(LLM)에 입력하여 해부학적 기반의 구조화된 보고서를 생성합니다.
실험 결과, 제안 모델은 자연어 생성 및 임상 효과 지표에서 우수한 성능을 보였습니다. 또한 시각적 실험을 통해 생성된 보고서의 구조화, 해석 가능성, 상호작용성을 입증하였습니다.
Stats
흉부 X선 영상에서 29개의 해부학적 영역을 감지하고 1024차원의 시각적 특징을 추출하였습니다.
문장 감지 모듈의 전체 F1 점수는 0.701이며, 정상 영역 문장 감지 정밀도는 0.341, 재현율은 0.869입니다.
비정상 감지 모듈의 전체 F1 점수는 0.557이며, 정밀도는 0.394, 재현율은 0.951입니다.
Quotes
"의료 보고서 생성은 방사선 영상에서 자동으로 방사선과 설명을 생성하여 의사의 부담을 줄이고 오류를 최소화합니다."
"현재 방법은 구조화된 출력과 의사의 상호작용이 부족하여 명확하고 임상적으로 관련성 있는 보고서를 생성하지 못합니다."