Core Concepts
一枚の実写スタイル画像ペアでトレーニングされた変形感知型フェイススタイリゼーションフレームワークが、望ましい変形を持つ多様で高品質なスタイル化された顔を生成する。
Abstract
この論文は、従来の単一画像スタイル参照から逸脱し、実際のスタイル画像ペアを選択する変形感知型フェイススタイリゼーションに焦点を当てています。自己監督学習ビジョントランスフォーマーであるDINO-ViTを使用して、現実とスタイルドメイン間で堅牢かつ一貫した顔の構造表現を確立します。提案された方法は、StyleGANジェネレーターを変形感知型に適応させることから始まります。方向性変形損失と相対的な構造的一貫性制約によってジェネレーターの微調整が行われ、色生成が参照と整合されます。このフレームワークは、約10分間の微調整期間で一般的なワンショットフェーススタイリゼーションにおける改善された変形性能を提供します。
Stats
提案されたフレームワークは、約10分間の微調整期間で効率的な結果を達成しています。
DINO特徴空間は、現実とスタイル顔ドメイン全体で強力な構造/意味表現を探求します。
Quotes
"We propose a deformation-aware face stylization framework trained on a single real-style image pair."
"Our method can accurately stylize facial images into artistic styles with strong exaggerations, both in appearance change and structure deformation."