이 연구는 이미지 표현 및 압축을 위한 새로운 패러다임인 GaussianImage를 제안한다.
먼저 2D 가우시안을 이용하여 이미지를 표현한다. 각 2D 가우시안은 위치, 공분산, 색상 계수, 불투명도 등 8개의 매개변수로 정의된다. 이는 3D 가우시안 대비 6.5배 압축이 가능하다.
다음으로 누적 합산 기반의 새로운 래스터라이제이션 알고리즘을 제안한다. 이는 깊이 정보에 의존하지 않고 모든 가우시안 포인트를 활용하여 효율적으로 이미지를 렌더링할 수 있다. 또한 색상 계수와 불투명도를 통합하여 매개변수 수를 8개로 줄일 수 있다.
마지막으로 벡터 양자화 기법을 활용하여 GaussianImage를 초고속 이미지 코덱으로 구현한다. 이를 통해 COIN 및 COIN++ 대비 유사한 압축 성능을 달성하면서도 약 1000 FPS의 초고속 디코딩 속도를 제공한다.
실험 결과, GaussianImage는 기존 암묵적 신경망 표현 방식 대비 훨씬 빠른 학습 및 추론 속도와 낮은 GPU 메모리 사용량을 보여준다. 또한 이미지 압축 성능 또한 기존 방식과 유사한 수준을 달성한다.
In eine andere Sprache
aus dem Quellinhalt
arxiv.org
Wichtige Erkenntnisse aus
by Xinjie Zhang... um arxiv.org 03-14-2024
https://arxiv.org/pdf/2403.08551.pdfTiefere Fragen