核心概念
ワッサーシュタイン歪みは、画像の忠実度と写実性を同時に評価する新しい指標である。従来の忠実度指標と写実性指標を一般化し、人間の視覚特性に基づいて定義されている。
要約
本論文では、画像の忠実度と写実性を同時に評価する新しい指標であるワッサーシュタイン歪みを提案している。
従来の画像圧縮アルゴリズムは、元画像と再現画像の画素レベルの忠実度を最大化することを目的としていた。しかし、このような手法では、ぼやけや歪みなどの人間の視覚に不自然な artifacts が生じる問題があった。近年、写実性を同時に最大化することで、これらの artifacts を低減できることが分かってきた。
本論文では、忠実度と写実性を統一的に扱うためにワッサーシュタイン歪みを定義する。この指標は、人間の視覚特性に基づいて設計されており、中心視野では忠実度を、周辺視野では写実性を重視するように設計されている。
具体的には、画像の各位置において、局所的な特徴量の分布を計算し、その分布間のワッサーシュタイン距離を歪み指標として定義する。この際、中心視野では狭い範囲の特徴量分布を、周辺視野では広い範囲の特徴量分布を用いることで、忠実度と写実性のトレードオフを表現できる。
実験では、この指標を用いて、中心部が元画像に忠実で、周辺部が独立な質感の画像を生成することができた。また、自然画像の再現においても、注目領域では忠実に、それ以外の領域では写実的に再現できることを示した。
本手法は、従来の忠実度指標と写実性指標を統一的に扱うことができ、人間の視覚特性に基づいた新しい画像評価指標として期待できる。
統計
画像の各位置における特徴量分布のワッサーシュタイン距離を歪み指標として定義している。