本手法は、テキストプロンプトとレイアウト指示の両方に合致した高品質な画像を生成することができる。具体的には、局所的な注意制約と余白トークン制約を提案し、既存のテキストツーイメージおよびレイアウトツーイメージモデルの性能を大幅に向上させる。