本論文では、テキストによる入力に基づいて一貫したキャラクターを生成する新しい手法を提案している。
まず、テキストによる入力から複数の画像を生成し、それらの特徴量を抽出する。次に、抽出した特徴量をクラスタリングし、最も一貫性の高いクラスターを選択する。その後、選択したクラスターを用いて、テキストに基づいた一貫したキャラクターの表現を学習する。この過程を繰り返すことで、最終的に一貫したキャラクターを生成することができる。
提案手法は、既存の手法と比較して、テキストの意味に忠実であり、かつキャラクターの一貫性も高いことが示されている。また、ユーザースタディの結果からも、提案手法の有効性が確認された。
最後に、提案手法を用いた様々なアプリケーションが紹介されている。
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問