提案手法は、自己注意制御と交差注意制御を通じて、エンティティのリークと属性の不整合を効果的に軽減する。
テキストからイメージを生成する際の整合性の問題を解決するため、画像キャプショニングモデルを活用したコンセプトマッチング手法を提案する。さらに属性集中モジュールを導入し、属性とエンティティの整合性も向上させる。
言語モデルの埋め込み空間を操作することで、テキストからイメージ生成モデルの偏りを動的かつ効率的に制御できる。これにより、通常のテキストプロンプトでは生成が困難な画像を生成することも可能になる。
2つの関連性の低い物体テキストを組み合わせることで、従来のテキストからイメージ生成手法では実現できない、新しく驚くべき組み合わせのオブジェクトを生成する。