Kernekoncepter
本研究では、人種、性別、年齢などの人口統計学的特徴だけでなく、ヘアスタイル、アクセサリー、メイクアップなどの非永続的な特徴も考慮した、より多様な顔画像データセットの生成手法を提案する。
Resumé
本研究では、顔画像データセットの多様性を高めるための手法を提案している。従来の顔画像データセットは人口統計学的特徴(年齢、性別、肌の色など)に偏っていたが、本手法では非永続的な特徴(ヘアスタイル、アクセサリー、メイクアップなど)も考慮することで、より幅広い顔の多様性を表現できるデータセットを生成する。
具体的な手順は以下の通り:
- 属性の収集と選別: 顔の多様な特徴を表す用語を収集し、適切なものを選別する。
- 属性の組み合わせ: 収集した属性を組み合わせて、画像生成のプロンプトを作成する。
- プロンプトの作成: 属性の組み合わせに加え、ネガティブプロンプトも設定し、高品質な画像生成を目指す。
- 生成モデルの利用: 作成したプロンプトを入力として、Stable Diffusionなどの生成モデルを使って画像を生成する。
生成された画像は手動でフィルタリングし、最終的なデータセット(SDFD)を構築した。SDFDは1000枚の画像から成り、従来のデータセットと比較して同等以上の難易度を持ちつつ、はるかに小さいサイズである。
Statistik
多様な人種の顔が生成されている
様々な年齢層の顔が生成されている
多様なヘアスタイル、アクセサリー、メイクアップが表現されている
Citater
"AI systems are typically trained on large scale datasets. However, if such datasets are not balanced and diverse, there is a risk of ending up with unfair and inaccurate AI systems."
"Face verification systems, for example, may fail due to various types of occlusion."