Core Concepts
本研究は、プロフェッショナルC4Iシステム向けの大規模かつ体系的なスケッチデータセットを構築し、同時の認識と分割を行う深層学習ネットワークを提案することで、スケッチ入力メソッドエディタの実用性を高めている。
Abstract
本研究は、プロフェッショナルC4Iシステム向けのスケッチ入力メソッドエディタの開発を目的としている。
まず、C4Iシステムの標準シンボルを基に、374種類の専門的なスケッチカテゴリからなる大規模なデータセットを構築した。このデータセットには、同一カテゴリ間の微妙な違いや、ユーザーの多様なスケッチングスタイルによる大きなばらつきが含まれている。
次に、同時の認識と分割を行う深層学習ネットワークを提案した。このネットワークは、認識ストリームの出力が分割ストリームの学習を監督することで、認識と分割の両タスクの性能を向上させ、かつ推論の解釈性を高めている。さらに、少量サンプルによるドメイン適応と少量クラス増分学習の手法を導入することで、新規ユーザーへの適応性と新規タスクへの拡張性を大幅に高めている。
実験の結果、提案手法は既存手法と比べて優れた認識と分割の性能を示し、ユーザーの多様なスケッチングスタイルにも適応できることが確認された。また、新規クラスの追加にも柔軟に対応できることが示された。
Stats
スケッチの認識精度は最大96.21%に達した。
スケッチの分割精度は最大97.13%に達した。
少量サンプルによるドメイン適応を行うことで、認識精度が89.50%から96.21%に大幅に向上した。
Quotes
"スケッチは、言語の壁を超えて人間社会をつなぐコミュニケーションモダリティである。"
"ユーザーが自身のスケッチングスタイルを持っていることから、SketchIMEシステムは、新規ユーザーに適応できる必要がある。"
"C4Iシステムには1000種類以上のスケッチシンボルが存在するため、SketchIMEシステムは新規タスク向けのクラスを拡張できる必要がある。"