本論文では、2つの物体テキストを組み合わせることで創造的なオブジェクトを生成する手法を提案する。
まず、テキストエンコーダーを使って2つの物体テキストのエンベディングを得る。次に、これらのエンベディングの要素をランダムに入れ替えることで新しいエンベディングを生成し、それをイメージジェネレーターに入力して新しいオブジェクトイメージを生成する。
さらに、生成されたイメージと元の2つのイメージの距離を制御する「バランス領域」を定義し、この領域内のイメージから最適なものを選択する。セグメンテーションモデルを使ってイメージ内の要素を分析し、元の物体との類似度が高い部分を選択することで、より自然な組み合わせのオブジェクトを得ることができる。
提案手法は、従来のテキストからイメージ生成手法では実現できない、驚くべき組み合わせのオブジェクトを生成することができる。人間の創造的な作品と比較しても遜色のない結果が得られることが示された。
Na inny język
z treści źródłowej
arxiv.org
Głębsze pytania