Core Concepts
DNNが画像の高次元密度からサンプリングする能力を向上させるために、幾何学適応的な調和基底が重要である。
Abstract
Zahra Kadkhodaieらによって発表されたICLR 2024の論文。
DNNは小さなトレーニングセットでサンプルを記憶し、大きなセットでは強力な一般化を実現。
デノイザーは幾何学適応的な調和基底で収縮操作を行い、高品質の画像生成を可能にする。
低次元多様体上で訓練されたDNNデノイザーは最適性を示すが、曲率の存在により部分的に効果が低下。
Stats
大きさ105の画像で訓練された2つのデノイザーは本質的に同じデノイジング関数に収束する。
ディスク画像の場合、最適MSEは5σ^2であり、PSNRスロープは1.0未満。
Quotes
"Diffusion generative models, which operate through iterative application of a trained DNN denoiser, have recently surpassed all previous methods of learning probability models of images."
"DNN denoisers perform shrinkage of noisy coefficients in a geometry-adaptive harmonic basis (GAHB) which is shaped by geometric features of the image."