이 연구는 이미지 표현 및 압축을 위한 새로운 패러다임인 GaussianImage를 제안한다.
먼저 2D 가우시안을 이용하여 이미지를 표현한다. 각 2D 가우시안은 위치, 공분산, 색상 계수, 불투명도 등 8개의 매개변수로 정의된다. 이는 3D 가우시안 대비 6.5배 압축이 가능하다.
다음으로 누적 합산 기반의 새로운 래스터라이제이션 알고리즘을 제안한다. 이는 깊이 정보에 의존하지 않고 모든 가우시안 포인트를 활용하여 효율적으로 이미지를 렌더링할 수 있다. 또한 색상 계수와 불투명도를 통합하여 매개변수 수를 8개로 줄일 수 있다.
마지막으로 벡터 양자화 기법을 활용하여 GaussianImage를 초고속 이미지 코덱으로 구현한다. 이를 통해 COIN 및 COIN++ 대비 유사한 압축 성능을 달성하면서도 약 1000 FPS의 초고속 디코딩 속도를 제공한다.
실험 결과, GaussianImage는 기존 암묵적 신경망 표현 방식 대비 훨씬 빠른 학습 및 추론 속도와 낮은 GPU 메모리 사용량을 보여준다. 또한 이미지 압축 성능 또한 기존 방식과 유사한 수준을 달성한다.
To Another Language
from source content
arxiv.org
ข้อมูลเชิงลึกที่สำคัญจาก
by Xinjie Zhang... ที่ arxiv.org 03-14-2024
https://arxiv.org/pdf/2403.08551.pdfสอบถามเพิ่มเติม