이 연구는 의료 영상 보고서의 비정형 텍스트를 구조화된 의미 표현으로 변환하기 위해 새로운 주석 말뭉치인 CAMIR를 소개한다. CAMIR는 CT, MRI, PET-CT 보고서 609개로 구성되며, 임상 적응증, 병변, 의학적 문제 등의 정보를 다양한 논거로 세분화하여 주석 처리했다. 특히 해부학적 개념을 계층적 온톨로지로 정규화했다는 점이 특징이다.
CAMIR를 활용하여 두 가지 BERT 기반 언어 모델, mSpERT와 PL-Marker++를 평가했다. PL-Marker++가 전반적으로 더 높은 성능(0.759 F1)을 보였으며, 특히 병변 관련 논거 추출에서 강점을 보였다. 이러한 구조화된 의미 표현은 임상 의사결정 지원, 역학 연구, 추적 관리 등 다양한 2차 활용 애플리케이션에 활용될 수 있다.
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문