이 연구는 병리학 분야에서 기반 모델 개발을 위해 다음과 같은 접근법을 제안한다:
데이터 큐레이션: 133,000개의 다양한 특성을 가진 슬라이드 데이터셋을 구축하였다. 이 데이터셋에서 12억 개의 이미지 패치를 추출하였다.
전산 분석과 병리학자 전문성 결합: 병리학자의 도움을 받아 슬라이드를 31개의 그룹으로 분류하고, 이미지 패치를 의미 있는 조직 클러스터로 그룹화하였다.
AI 학습: DINOv2 학습 방식을 적용하고, 염색 변화를 포함한 데이터 증강 기법을 사용하여 모델을 학습하였다.
응용: 개발된 기반 모델은 다양한 디지털 병리학 응용 분야에 활용될 수 있다.
이러한 접근법을 통해 기존 모델 대비 적은 데이터와 작은 모델 크기에도 불구하고 우수한 성능을 달성하였다. 향후 더 많은 데이터와 큰 모델로 확장한다면 성능과 복잡한 실제 세계 과제 해결 능력이 크게 향상될 것으로 기대된다.
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Jona... lúc arxiv.org 03-13-2024
https://arxiv.org/pdf/2401.04079.pdfYêu cầu sâu hơn