テキスト主導型ディフュージョンモデルにおいて、グローバルなクラシファイアフリーガイダンス(CFG)スケールは、セマンティックの強さの空間的な不整合と最終的な画質の劣化をもたらす。そこで、異なるセマンティック領域に対して個別のCFGスケールを適応的に設定する新しいアプローチ「セマンティック認識に基づくクラシファイアフリーガイダンス(S-CFG)」を提案する。