ビジョントランスフォーマーを用いた単純かつデータ効率的な手書き文字認識手法を提案し、従来手法を上回る性能を実現した。
リラクセーションラベリング(RL)プロセスを様々な既存の手書き文字認識ニューラルネットワークアーキテクチャに統合することで、一般化性能を大幅に向上させることができる。スパース化手法を用いることで、RLプロセスの収束を加速し、システム全体の性能を向上させることができる。
手書き文字認識システムの性能を向上させるための簡単かつ効果的な実践的アプローチを提案する。
深層学習アルゴリズムは、さまざまな分野で人間レベルの性能を達成してきた。特に、コンピュータビジョンやパターン認識の分野で大きな進歩を遂げている。本論文は、手書き文字認識分野における深層学習の既存研究に関するサーベイを行う。深層学習手法は手書き文字認識の精度向上や処理速度の向上に貢献してきたが、まだ多くの課題を抱えており、さらなる革新的な進歩が期待される。