מושגי ליבה
提案モデルは、キャラクタの他の方向の画像を入力として受け取り、欠損している方向の画像を生成する。
תקציר
本研究では、ピクセルアートキャラクタースプライトの生成問題を欠損データ補完タスクとして捉え、提案モデルを開発した。提案モデルは、キャラクタの他の方向の画像を入力として受け取り、欠損している方向の画像を生成する。
具体的には以下の通り:
- 生成器は4つのエンコーダブランチを持ち、各ブランチが入力画像を処理する。エンコーダの出力は結合され、単一のデコーダに入力される。
- 生成器の損失関数には、回帰損失、サイクル整合性損失、構造的類似性損失、敵対的損失、ドメイン分類損失の5つの項目がある。
- 識別器は、入力画像が本物か偽物かを判別するとともに、その画像のドメイン(方向)を分類する。
- 訓練時には、入力画像をランダムに欠損させる手法を採用し、欠損数が少ない場合でも良好な結果が得られるようにした。
提案モデルは、Pix2Pix、StarGANなどの既存手法と比較して、FIDとL1距離の両指標で優れた性能を示した。また、入力画像の数が少ない場合でも、他の手法よりも良好な結果が得られることが確認された。
סטטיסטיקה
生成器の推論時間は約116ms
生成器の総パラメータ数は104,887,616
識別器の総パラメータ数は44,726,272