生成的な潜在表現を用いることで、画像品質を効率的に予測できる。
Dog-IQAは、大規模マルチモーダル言語モデル(MLLM)の事前知識を活用し、画像の全体的な品質と局所的な品質の両方を考慮することで、従来のトレーニングフリーなIQA手法よりも優れた性能を実現する、トレーニングフリーな混合粒度画像品質評価手法である。