本研究では、ユーザーの過去の入力プロンプトを活用し、ユーザーの嗜好に合わせてプロンプトを書き換えることで、テキストから画像生成の精度を向上させる手法を提案している。
まず、大規模なテキストから画像生成のデータセットを構築し、ユーザーの過去の入力プロンプトを収集した。このデータセットを用いて、ユーザーの嗜好を反映したプロンプト書き換えモデルを学習した。
具体的な手順は以下の通り。
実験の結果、提案手法は既存手法と比べて、ユーザーの嗜好に合った画像を生成できることが示された。オフラインの評価指標だけでなく、実際のユーザーによる評価でも高い評価を得ている。
このように、ユーザーの過去の入力履歴を活用することで、テキストから画像生成の精度を大幅に向上させることができる。今後は、ユーザーの属性情報などをさらに活用することで、より高度な個人化が期待できる。
Till ett annat språk
från källinnehåll
arxiv.org
Djupare frågor