核心概念
スケッチ描画順序の情報をグラフノードに埋め込むことで、スケッチ表現学習の精度を向上させる。
要約
本論文は、スケッチ描画順序の情報をグラフ構造に効果的に活用する手法を提案している。
スケッチパッチの表現にはCNNエンコーダを用いて特徴を抽出する。
絶対位置エンコーディングを使ってパッチの描画順序を表現し、相対位置エンコーディングを使ってパッチ間の文脈的な位置関係を表現する。
これらのエンコーディングをGCNエンコーダに入力することで、視覚的特徴と描画順序の情報を統合した表現を得る。
実験の結果、提案手法はスケッチ修復やスケッチ合成の性能を大幅に向上させることが示された。
統計
スケッチ修復タスクにおいて、提案手法はベースラインと比べて以下の性能を示した:
DS1データセットでRecall@1が94.45%、Recall@10が94.45%、Recall@50が94.45%
DS2データセットでRecall@1が88.83%、Recall@10が88.83%、Recall@50が88.83%
DS3データセットでRecall@1が92.35%、Recall@10が92.35%、Recall@50が92.35%