본 연구는 의료 영상 분석을 위한 자기 지도 학습(SSL) 기술을 개선하기 위해 최적 수송(OT) 개념을 통합한 OPTiML 프레임워크를 제안한다.
OPTiML의 핵심 구성 요소는 다음과 같다:
OT 통합: OPTiML은 OT를 SSL 프레임워크에 통합하여 의료 영상 표현 학습에서 밀집 의미 불변성을 달성한다. OT는 두 이미지 간의 최적 전송 계획을 결정하여 의미적으로 관련된 특징을 정렬한다.
CV-SIM 모듈: CV-SIM 모듈은 다양한 관점에서 미세한 세부 사항을 포착하여 전체적인 표현을 향상시킨다. 이는 다중 헤드 교차 주의 메커니즘을 사용하여 쿼리와 키 사이의 복잡한 관계를 학습한다.
분산 및 공분산 정규화: OPTiML은 분산 및 공분산 정규화를 통해 정보적이고 중복되지 않은 표현을 생성한다. 분산 정규화는 표현의 안정성을 보장하고, 공분산 정규화는 해부학적 구조 또는 병리학적 패턴 간의 복잡한 공간적 및 상황적 관계를 보존한다.
실험 결과, OPTiML은 다양한 의료 영상 작업에서 기존 SSL 방법보다 우수한 성능을 보였다. 특히 제한된 레이블 데이터 환경에서도 강력한 일반화 능력을 입증했다.
toiselle kielelle
lähdeaineistosta
arxiv.org
Tärkeimmät oivallukset
by Azad Singh,V... klo arxiv.org 04-19-2024
https://arxiv.org/pdf/2404.11868.pdfSyvällisempiä Kysymyksiä