제한된 레이블 데이터를 활용하여 긍정 레이블 없는 데이터로부터 유용한 표현을 학습하는 새로운 대조 학습 목적함수 puNCE를 제안한다.
심층 신경망 모델은 데이터 분포의 희박 영역에 있는 저근접 샘플에 대해 과도하게 자신감을 표현하는 근접성 편향 문제가 있으며, 이는 기존 보정 알고리즘으로도 해결되지 않는다. 이를 해결하기 위해 근접성 정보를 활용한 보정 방법 PROCAL을 제안한다.