본 연구는 의료 영상 분석을 위한 자기 지도 학습(SSL) 기술을 개선하기 위해 최적 수송(OT) 개념을 통합한 OPTiML 프레임워크를 제안한다.
OPTiML의 핵심 구성 요소는 다음과 같다:
OT 통합: OPTiML은 OT를 SSL 프레임워크에 통합하여 의료 영상 표현 학습에서 밀집 의미 불변성을 달성한다. OT는 두 이미지 간의 최적 전송 계획을 결정하여 의미적으로 관련된 특징을 정렬한다.
CV-SIM 모듈: CV-SIM 모듈은 다양한 관점에서 미세한 세부 사항을 포착하여 전체적인 표현을 향상시킨다. 이는 다중 헤드 교차 주의 메커니즘을 사용하여 쿼리와 키 사이의 복잡한 관계를 학습한다.
분산 및 공분산 정규화: OPTiML은 분산 및 공분산 정규화를 통해 정보적이고 중복되지 않은 표현을 생성한다. 분산 정규화는 표현의 안정성을 보장하고, 공분산 정규화는 해부학적 구조 또는 병리학적 패턴 간의 복잡한 공간적 및 상황적 관계를 보존한다.
실험 결과, OPTiML은 다양한 의료 영상 작업에서 기존 SSL 방법보다 우수한 성능을 보였다. 특히 제한된 레이블 데이터 환경에서도 강력한 일반화 능력을 입증했다.
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Azad Singh,V... a las arxiv.org 04-19-2024
https://arxiv.org/pdf/2404.11868.pdfConsultas más profundas