toplogo
Đăng nhập

대형 병원 간 공유 기반 모델의 적응성에 대한 다기관 연구


Khái niệm cốt lõi
공유 기반 모델을 활용하면 병원 간 예측 성능을 향상시키면서도 비용을 절감할 수 있다.
Tóm tắt

이 연구는 전자 건강 기록(EHR) 데이터를 위한 공유 기반 모델의 적응성을 다기관에서 평가했다. 주요 내용은 다음과 같다:

  1. 스탠포드 의과대학에서 개발한 외부 기반 모델(FMSM)을 SickKids와 MIMIC-IV 데이터셋에 적용했다.

  2. FMSM을 현지 데이터로 지속적으로 사전 학습(continued pretraining)하면 기존 기준 모델(GBM)보다 예측 성능이 향상되었다. 특히 적은 수의 레이블 데이터로도 GBM과 동등한 성능을 달성할 수 있었다.

  3. 지속적 사전 학습은 처음부터 현지 기반 모델을 학습하는 것보다 60-90% 더 적은 환자 데이터로도 동등한 성능을 달성할 수 있었다.

  4. 외부 기반 모델(FMSM)이 현지 기반 모델(FMSK, FMMIMIC)보다 다른 병원 데이터에 더 잘 적응하는 것으로 나타났다.

이 결과는 공유 EHR 기반 모델을 활용하면 병원 간 예측 성능을 향상시키면서도 비용을 절감할 수 있음을 보여준다. 또한 기존 모델의 지속적 사전 학습이 처음부터 모델을 학습하는 것보다 더 효율적임을 확인했다.

edit_icon

Customize Summary

edit_icon

Rewrite with AI

edit_icon

Generate Citations

translate_icon

Translate Source

visual_icon

Generate MindMap

visit_icon

Visit Source

Thống kê
스탠포드 의과대학 데이터셋에는 257만 명의 환자 기록이 포함되어 있다. SickKids 데이터셋에는 180만 명의 환자 기록이, MIMIC-IV 데이터셋에는 34만 명의 환자 기록이 포함되어 있다. 8개의 임상 예측 과제에 대해 평가했으며, 이 중 6개 과제에서 MIMIC 데이터셋의 결과 발생률이 SickKids 데이터셋보다 1.3배에서 6배 더 높았다.
Trích dẫn
"공유 EHR 기반 모델을 활용하면 병원 간 예측 성능을 향상시키면서도 비용을 절감할 수 있다." "지속적 사전 학습은 처음부터 현지 기반 모델을 학습하는 것보다 60-90% 더 적은 환자 데이터로도 동등한 성능을 달성할 수 있었다."

Thông tin chi tiết chính được chắt lọc từ

by Lin Lawrence... lúc arxiv.org 04-24-2024

https://arxiv.org/pdf/2311.11483.pdf
A Multi-Center Study on the Adaptability of a Shared Foundation Model  for Electronic Health Records

Yêu cầu sâu hơn

병원 간 데이터 표준화와 개인정보 보호 문제를 어떻게 해결할 수 있을까?

병원 간 데이터 표준화와 개인정보 보호 문제를 해결하기 위해서는 몇 가지 중요한 접근 방식이 있습니다. 첫째, 데이터 표준화를 위해 OMOP CDM와 같은 공통 데이터 모델을 사용하여 데이터를 일관되게 변환하고 표준화하는 것이 중요합니다. 이를 통해 다양한 병원에서 수집된 데이터를 효율적으로 비교하고 공유할 수 있습니다. 둘째, 데이터를 익명화하고 HIPAA 기준에 맞게 처리하여 개인정보 보호를 보장해야 합니다. 또한, 데이터 접근을 제한하고 인증된 사용자만이 데이터에 접근할 수 있도록 하는 것이 중요합니다. 마지막으로, 데이터 공유 및 사용에 대한 엄격한 규정과 윤리적 가이드라인을 마련하여 데이터의 안전한 활용을 보장해야 합니다.
0
star