NeuroPrompts は、テキストから画像生成モデルの性能を最大限に引き出すためのプロンプト最適化フレームワークです。
まず、事前に訓練された言語モデルを、人間のプロンプトエンジニアが作成するプロンプトのスタイルに適応させます。次に、この適応済みの言語モデルを使って、ユーザーが入力したプロンプトを最適化します。この際、制約付きテキスト生成手法であるNeuroLogicを用いることで、ユーザーが好みのスタイルや属性を指定できるようになっています。
実験の結果、NeuroPrompts によって最適化されたプロンプトを使うと、Stable Diffusionによって生成された画像の美的評価スコアが大幅に向上することが示されました。さらに、人間のプロンプトエンジニアが作成したプロンプトを上回る性能を発揮することも確認されました。
このように、NeuroPrompts はテキストから画像生成モデルの潜在能力を引き出し、ユーザーの専門知識なしでも高品質な画像を生成できるようにします。
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問