The author proposes a method to classify and alleviate artifacts in synthetic images using a Vision-Language Model, resulting in improved image quality.
合成画像のアーティファクトを分類し、軽減するためにVision-Languageモデルを使用する方法を提案します。