核心概念
グラフニューラルネットワークを使って、アイテムの組み合わせの適合性を定量的に評価し、ファッション推奨を行う。
摘要
本研究では、ファッション業界におけるアイテムの組み合わせの適合性を定量的に評価するために、グラフニューラルネットワーク(GNN)を活用する。具体的には以下の2つのアプローチを検討している。
- ノードごとのグラフニューラルネットワーク(NGNN)
- アイテムのカテゴリー情報を重視して、カテゴリー依存の重み付きメッセージ伝播を行う。
- カテゴリー固有の特徴マッピングを使ってアイテムの埋め込みを生成する。
- アテンションメカニズムを使ってアウトフィットの適合性スコアを算出する。
- ハイパーグラフニューラルネットワーク(HGNN)
- アウトフィットをハイパーエッジで表現し、アイテムのカテゴリー間の高次の相互作用をモデル化する。
- ハイパーエッジを2つのノードに変換し、中間ノードを介して情報を伝播させる。
これらの2つのアプローチを、ファッションアイテムの画像とテキスト情報を用いて評価した。具体的には、(1)アウトフィットの欠損アイテムを補完する「Fill-in-the-blank」タスクと、(2)アウトフィットの適合性を予測する「適合性予測」タスクで比較した。
結果として、HGNNがわずかに優れた性能を示した。また、画像と文章の両方の情報を使う multimodal アプローチが、単一モダリティよりも高い精度を達成した。
本研究により、ファッションアイテムの組み合わせの適合性を自動的に評価し、ユーザーに推奨することが可能になる。これにより、ファッション業界のオンラインプラットフォームにおける使いやすさ、購買意欲、収益の向上が期待できる。
統計資料
ランダムモデルの「Fill-in-the-blank」精度は24%である。
NGNNモデルの「Fill-in-the-blank」精度は38%、「適合性予測」のAUCは0.65である。
HGNNモデルの「Fill-in-the-blank」精度は39%、「適合性予測」のAUCは0.76である。
ViTを使ったNGNNモデルの「Fill-in-the-blank」精度は40%、「適合性予測」のAUCは0.68である。
ViTを使ったHGNNモデルの「Fill-in-the-blank」精度は40%、「適合性予測」のAUCは0.77である。
引述
「ファッショングラフを使ったNGNNとHGNNのフレームワークは、アウトフィットの組み立てや
ファッション選択の面倒な作業を一定程度自動化できることを示している。」
「これらのツールを活用することで、ファッション業界の企業がオンラインプラットフォームでユーザーにアイテム推奨を行い、
ユーザビリティ、購買意欲、収益の向上につなげることができる。」