核心概念
LIPT는 실시간 이미지 처리를 위해 메모리 집약적 연산을 줄이고 비휘발성 희소 마스킹 자기 주의 메커니즘과 고주파 재매개화 모듈을 도입하여 고품질 이미지 복원을 달성합니다.
摘要
이 논문은 저지연 이미지 처리 트랜스포머(LIPT)를 제안합니다. LIPT는 실시간 이미지 처리를 위해 메모리 집약적 연산을 줄이는 새로운 LIPT 블록을 설계했습니다.
LIPT 블록의 핵심 구성요소는 다음과 같습니다:
- 비휘발성 희소 마스킹 자기 주의 메커니즘(NVSM-SA): 추가 계산 없이 더 큰 수용 영역을 캡처하여 장거리 의존성을 모델링합니다.
- 고주파 재매개화 모듈(HRM): 가장자리와 질감을 더 잘 복원하기 위해 다중 분기 컨볼루션과 고주파 특징 추출 연산자를 융합합니다.
실험 결과, LIPT는 다양한 이미지 처리 작업에서 기존 경량 트랜스포머 모델보다 우수한 지연 시간과 PSNR 성능을 달성했습니다. 특히 LIPT-Tiny는 실시간 이미지 SR을 달성하면서도 CNN 모델과 비교할 만한 PSNR 성능을 보였습니다.
统计
이미지 SR 작업에서 LIPT-Small은 ELAN-Light보다 1.8배 더 빠른 GPU 추론 속도(99ms vs. 177ms)를 달성하면서도 Urban100에서 0.11dB 더 높은 PSNR 성능을 보였습니다.
引用
"LIPT는 실시간 이미지 처리를 위해 메모리 집약적 연산을 줄이는 새로운 LIPT 블록을 설계했습니다."
"NVSM-SA는 추가 계산 없이 더 큰 수용 영역을 캡처하여 장거리 의존성을 모델링합니다."
"HRM은 가장자리와 질감을 더 잘 복원하기 위해 다중 분기 컨볼루션과 고주파 특징 추출 연산자를 융합합니다."