LiFT는 사전 학습된 비전 트랜스포머 백본의 특징을 향상시키는 간단하고 효과적인 자기지도 학습 방법이다. LiFT는 최소한의 추가 연산 비용으로 비전 트랜스포머 특징의 밀도를 높여 다양한 밀집 작업에서 성능 향상을 달성한다.
LiFT는 사전 학습된 비전 트랜스포머 특징을 간단하고 효율적으로 향상시키는 자기지도 학습 기법이다.
본 연구에서는 기존 비전 트랜스포머 모델의 낮은 공간 해상도 문제를 해결하기 위해 간단하면서도 효과적인 경량 특징 변환 기법 LiFT를 제안한다. LiFT는 사전 학습된 비전 트랜스포머 모델의 특징을 향상시켜 다양한 밀집 작업에서 성능 향상을 달성한다.
LiFT는 사전 학습된 비전 트랜스포머 특징을 간단하고 효율적으로 밀도 높은 특징으로 변환하는 자기지도 학습 기법이다.