Główne pojęcia
전자 건강 기록에서 추출한 질병 데이터를 표준화하여 의사 연구 활동을 지원하는 것이 이 연구의 핵심 목적이다.
Streszczenie
이 연구는 전자 건강 기록(EHR)에서 질병 데이터와 인구통계 데이터를 추출하고 표준화하는 시스템 모델을 제안한다.
데이터 전처리 단계에서는 성별, 나이, 진단일 등의 인구통계 데이터를 표준화한다. 질병 명칭 인식 단계에서는 기계 학습 모델을 사용하여 진단 텍스트에서 질병 명칭을 인식한다. 이후 변환 단계에서 인식된 질병 명칭을 ICD-10 코드로 변환한다.
모델의 성능은 기존 사전 기반 시스템(MetaMap)과 비교 평가되었으며, 제안 모델의 정확도가 81%로 MetaMap의 67%를 상회하는 것으로 나타났다.
최종적으로 표준화된 데이터는 대화형 시각화 플랫폼에 제공되어 의사 연구 활동을 지원한다.
Statystyki
환자 나이는 16, 20년, 4개월, 2 1/2 등 다양한 형식으로 표현되어 있다.
성별은 "F", "female", "Female" 등 여러 형식으로 기록되어 있다.
진단일은 "8/7/1439", "11/8/1439", "more than 10 years" 등 다양한 형식으로 나타난다.
Cytaty
"ICD는 질병 목록, 통계, 저장을 단순화하기 위해 각 질병에 특정 기호(코드)를 할당한다."
"수동 ICD 코딩은 의사 교육 비용을 높이고 수천 개의 코드 중에서 원하는 코드를 찾는 데 더 많은 시간이 소요되어 잘못된 코드를 선택할 수 있다."