Conceptos Básicos
DeIDClinic은 임상 텍스트에서 환자 식별 정보를 효과적으로 식별하고 마스킹하는 다층 프레임워크이다.
Resumen
이 연구는 MASK 프레임워크를 향상시켜 ClinicalBERT, 사전 조회 및 규칙 기반 접근법을 통합하였다. 이를 통해 이름, 날짜, 위치와 같은 일반적인 개체에 대해 0.9732의 F1 점수를 달성하며 개체 인식 성능을 크게 향상시켰다. 또한 문서 수준의 위험 평가 기능을 개발하여 고위험 개체가 포함된 문서를 식별할 수 있게 하였다. 사용자 친화적인 인터페이스를 통해 사용자가 익명화 설정을 쉽게 구성하고 개체 관리를 사용자 정의할 수 있도록 하였다. 이 시스템은 임상 데이터의 안전한 공유를 위해 환자 프라이버시를 더 잘 보호할 수 있는 강력하고 사용자 친화적인 프레임워크를 제공한다.
Estadísticas
전체 문서에서 181개의 민감한 개체가 식별되었다.
다층 개체 인식 알고리즘은 193개의 개체를 식별하였다.
정밀도는 0.9378, 재현율은 1.0, F1 점수는 0.9679이다.
Citas
"DeIDClinic은 임상 텍스트에서 환자 식별 정보를 효과적으로 식별하고 마스킹하는 다층 프레임워크이다."
"ClinicalBERT 통합으로 개체 인식 성능이 크게 향상되었다."
"문서 수준의 위험 평가 기능을 통해 고위험 개체가 포함된 문서를 식별할 수 있다."