본 논문은 연속 롤링 셔터 프레임에서 직접 왜곡 흐름을 추정하여 고품질의 글로벌 셔터 이미지를 복원하는 새로운 프레임워크를 제안한다.
3차원 컨볼루션 신경망을 사용하여 인접한 픽셀과 시간/스펙트럼 빈의 정보를 결합함으로써 개별 구성 요소를 효과적으로 분리할 수 있습니다.
CLIP의 이미지-텍스트 정렬을 활용하여 참조 이미지 분할 성능을 향상시킬 수 있다.
잡음이 섞인 신호에서 특정 통계적 특성을 복구하는 새로운 방법론을 제안한다. 잡음 샘플에 대한 접근이 가능할 때, 잡음이 섞인 신호의 통계적 특성과 복구된 신호의 통계적 특성이 일치하도록 하는 최적화 문제를 해결한다.
전문가 사진 데이터를 활용하여 주제 인식 기반 이미지 크롭핑 모델을 약한 감독 하에 학습하는 방법을 제안한다.
입력 이미지와 네트워크 층의 민감도에 따라 동적으로 비트폭을 할당하여 정확도와 계산 복잡도의 균형을 달성하는 방법을 제안한다.
이미지 합성 기술을 활용하여 기존 데이터셋보다 더 현실적이고 탐지하기 어려운 이미지 위조 데이터셋을 자동으로 생성한다.
MULAN은 단일 RGB 이미지를 배경과 개별 객체 인스턴스로 구성된 다층 RGBA 분해로 변환하는 새로운 데이터셋이다. 이를 통해 정밀한 이미지 조작과 편집이 가능해진다.
이미지 지리적 위치 추정 모델은 서구 국가 중심의 데이터셋으로 학습되어 개발도상국 지역의 복잡성을 이해하는 데 어려움을 겪는다.
구조화된 확산 모델과 압축 최적화를 결합하여 효율적이고 해석 가능한 마스크 자동인코딩 모델 CRATE-MAE를 제안한다.