Concepts de base
자연어 처리 기술을 활용하여 기존 자유 텍스트 방사선 보고서를 구조화된 보고서 형식으로 변환하여 자동으로 림프종 환자의 CT 병기 평가 정보를 추출할 수 있다.
Résumé
이 연구는 자연어 처리 기술을 활용하여 기존 자유 텍스트 방사선 보고서를 구조화된 보고서 형식으로 변환하는 파이프라인을 제안한다. 특히 이탈리아 의료 및 중재 방사선학회(SIRM)에서 제안한 CT 기반 림프종 환자 병기 평가 레지스트리를 대상으로 한다.
연구에서는 다음과 같은 주요 내용을 다룬다:
- 자연어 처리 기반 질문 답변(QA) 모델인 IT5를 활용하여 구조화된 보고서 자동 생성
- 모델의 입력 길이 제한 문제를 해결하기 위한 두 가지 전략(batch-truncation, ex-post combination) 비교
- IT5 모델과 GPT-3.5 모델의 성능 비교
- 자동 생성 답변에 대한 의료 전문가 평가 수행
실험 결과, ex-post combination 전략을 적용한 IT5 모델이 가장 우수한 성능을 보였다. 특히 "해당 없음(N.A.)" 답변을 적절히 구분하는 능력이 뛰어났다. 반면 GPT-3.5는 더 현실적인 답변을 생성하는 것으로 나타났다.
이 연구는 자연어 처리 기술을 활용하여 기존 자유 텍스트 방사선 보고서를 구조화된 형식으로 변환하는 파이프라인을 제안하였다. 이를 통해 방사선과 전문의의 업무 효율성을 높이고 데이터 활용성을 향상시킬 수 있을 것으로 기대된다.
Stats
검사는 MD 나선 기법으로 수행되었으며 비이온성 요오드화 조영제 정맥 주사 후 촬영되었다.
림프절 병변은 경부 측면, 상부 흉곽 입구, 기관 주변, 식도 주변 양측에서 관찰되었다.
종양의 최대 횡단면 크기는 16mm이고, 최대 직경에 수직인 축의 크기는 27mm이다.
Citations
"자연어 처리 기술을 활용하여 기존 자유 텍스트 방사선 보고서를 구조화된 보고서 형식으로 변환하는 파이프라인을 제안한다."
"IT5 QA 모델은 방사선과 레지스트리 자동 생성을 위한 유망한 옵션이다."
"ex-post combination 전략을 적용한 IT5 모델이 가장 우수한 성능을 보였으며, 특히 '해당 없음(N.A.)' 답변을 적절히 구분하는 능력이 뛰어났다."