本研究では、テキスト-画像拡散モデルの潜在空間内の意味的概念を自己発見する手法を提案した。
まず、特定の概念に関連する画像を生成し、その概念を表す潜在ベクトルを最適化する。
次に、発見された概念ベクトルを利用して、公平性、安全性、責任あるテキストガイダンスを持つ画像生成を実現した。
具体的には以下の通り:
提案手法は、既存の安全性向上手法と組み合わせることで、さらなる改善が可能であることを示した。
また、発見された概念ベクトルは、一般的な意味的概念を表現できる汎用性も持つことを確認した。
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Hang Li,Chen... at arxiv.org 03-29-2024
https://arxiv.org/pdf/2311.17216.pdfDeeper Inquiries