本研究では、テキストから写真を生成する際に、特定のオブジェクトにボケ効果を適用できる新しい生成型モデル「GBSD」を提案している。
GBSD は2段階の条件付けアルゴリズムを用いて、潜在的ディフュージョンモデルと組み合わせることで、写真の構造や色を生成した後に、特定のオブジェクトにボケ効果を適用することができる。
第1段階では、画像全体の構造や色を生成する。第2段階では、特定のオブジェクトにフォーカスを当てながら、同時にボケ効果を適用する。これにより、従来の手法では実現が難しかった、セマンティックなボケ効果を生成することができる。
GBSD は、テキストから写真を生成する場合だけでなく、既存の写真を入力として、特定のオブジェクトにボケ効果を適用することもできる。定量的・定性的な評価から、GBSD は従来手法よりも優れた性能を示すことが確認された。
לשפה אחרת
מתוכן המקור
arxiv.org
תובנות מפתח מזוקקות מ:
by Jieren Deng,... ב- arxiv.org 04-18-2024
https://arxiv.org/pdf/2306.08251.pdfשאלות מעמיקות