본 논문에서는 3D 컨볼루션과 양방향 교차 차원 엔트로피 모델을 활용하여 스테레오 이미지 압축 성능을 향상시키는 새로운 양방향 압축 방식인 BiSIC를 제안합니다.
This paper introduces BiSIC, a novel bidirectional stereo image compression method that leverages 3D convolutions and a cross-dimensional entropy model to achieve superior rate-distortion performance compared to existing techniques.
본 논문에서는 3D 가우시안 스플래팅(3DGS) 기반의 새로운 단층 촬영 재구성 프레임워크인 R$^2$-Gaussian을 제안하며, 이는 기존 3DGS의 고유한 적분 편차를 해결하여 X선 단층 촬영에서 정확하고 효율적인 부피 복원을 가능하게 합니다.
本稿では、3Dガウシアンスプラッティング(3DGS)に基づいた、高速かつ高精度なスパースビュー断層撮影再構成フレームワーク「R2-Gaussian」を提案する。従来の3DGS手法における積分バイアスの問題を、3Dガウシアンから2Dガウシアンへの射影のリファクタリングによって解決する新しい手法を提案する。
在模型規模、訓練數據和計算資源相同的情況下,基於 GAN 的圖像超分辨率模型的性能與基於擴散的模型相當,甚至更好,這表明擴散模型的優勢可能源於其規模和計算資源,而非模型本身。
R$^2$-Gaussian is a novel 3D Gaussian splatting-based framework that rectifies integration bias in traditional methods to achieve faster and more accurate sparse-view tomographic reconstruction.
동일한 조건에서 훈련된 GAN 기반 초고해상도 모델은 최신 확산 모델과 비슷하거나 더 나은 성능을 보여주며, 특히 고전적인 초고해상도 작업에서 뛰어나고, 야생 이미지 초고해상도에서는 유사한 품질을 제공합니다.
大規模化と計算リソースの増加を考慮した公平な比較設定において、画像超解像タスクではGANベースのモデルは拡散モデルと同等以上の性能を発揮できる。
While diffusion-based models are widely perceived as superior for image super-resolution (ISR), this research demonstrates that GAN-based models can achieve comparable or even better results with significantly lower computational requirements when appropriately scaled in terms of architecture, training data, and resources.
本文介紹了一個名為 FungiTastic 的全新、具有挑戰性的多模態真菌圖像數據集和基準測試,該數據集包含豐富的元數據,並針對多種計算機視覺任務(例如閉集和開集分類、小樣本學習、領域轉移和分割)設計了基準測試。