Core Concepts
新しい拡散ベースの技術は、高品質な画像を生成する能力を示し、参照画像から主題属性を正確に取得するRetriNetアーキテクチャが優れたパフォーマンスを発揮します。
Abstract
新しい拡散ベースの技術は、幅広い高品質画像を生成する能力を示しており、主題駆動型生成という分野が進化しています。
Subject-Driven Generationは、主題属性を取得し、不要な情報を除外するRetriNetアーキテクチャに焦点を当てています。
RetriBooruデータセットは、アニメキャラクターイメージに基づくマルチタスクおよびマルチコンセプトデータセットであり、高品質かつ挑戦的な基盤です。
Stats
InstantID [49]では48 NVIDIA H800 GPUs(80GB)で訓練されました。
RetriBooruデータセットはDanbooru 2019 Figuresデータセットから構築されました。
Quotes
"RetriNet demonstrates impressive performance when compared to existing state-of-the-art approaches in face generation."
"We propose RetriBooru, a multitask, multiconcept anime dataset based on Danbooru, one of the largest anime image datasets focusing on higher-quality images and better tagging."