SASSL은 이미지의 스타일을 변환하여 다양한 훈련 샘플을 생성하는 새로운 데이터 증강 기법으로, 자기 지도 학습에서 의미 정보를 유지하면서도 이미지 표현 학습을 향상시킵니다.
본 논문에서는 레이블이 지정되지 않은 대량의 엑스레이 이미지 데이터를 활용하여 밀집 예측 작업을 위한 시각적 자기 지도 학습(SSL) 방식인 Segment Localization(SegLoc)을 제안합니다.
유아의 능동적인 시선 처리 방식은 사물을 다양한 각도에서 인식하는 데 중요한 역할을 하며, 이러한 방식을 모방한 자기 지도 학습 모델은 기존 모델보다 월등한 객체 인식 능력을 보여준다.
본 논문에서는 최적화 정보 없이 생성 모델에서 생성된 솔루션만을 사용하여 잡숍 스케줄링 문제를 해결하는 새로운 자기 지도 학습 방법론인 SLIM(Self-Labeling Improvement Method)을 제안합니다.
MR-HuBERT의 성능 향상은 다운샘플링보다는 보조 손실 함수에 기인하며, 다운샘플링은 계산 효율성을 높이지만 표현 학습에는 큰 영향을 미치지 않는다.
본 논문에서는 의료 영상 데이터 부족 문제를 해결하기 위해 X-ray 이미지에서 해부학적 랜드마크를 검출하는 데 Diffusion 모델을 활용한 새로운 자기 지도 사전 학습 방법을 제안하며, 소량의 라벨링된 데이터만으로도 우수한 성능을 달성할 수 있음을 보여줍니다.
SimSiam+VAE와 SimSiam 네이밍 게임(SSNG)이라는 새로운 모델을 제시하여, 변분 추론(VI)의 관점에서 차별적 대조 SSL 기반 표현 학습과 생성적 CPC 기반 emergent communication을 연결합니다.
이 연구는 레이블이 지정된 데이터가 부족한 의료 영상 분류 작업에서 제한된 작업별 데이터에 대한 최소한의 추가 SSL 사전 학습이 ImageNet에 대한 대규모 SSL 사전 학습만큼 효과적일 수 있음을 시사합니다.
본 논문에서는 다양한 채널 구성을 가진 바이오 시그널 데이터셋에 적용 가능한 자기 지도 학습 모델을 제안하며, 특히 입력 채널의 무작위 하위 집합을 사용하여 양의 쌍을 생성하는 대조적 랜덤 리드 코딩(CRLC) 기법을 소개하고 그 효과를 입증합니다.
SKA 데이터 분석을 위해 특별히 설계된 자기 지도 비전 트랜스포머인 SKATR은 계산적으로 저렴한 저해상도 시뮬레이션에서 학습된 정보를 활용하여 고해상도 21cm 우주론적 신호에서도 우수한 성능과 높은 데이터 효율성을 달성할 수 있습니다.